Pular navegação.
Início

Status do cluster

Nos dias 18 e 21 de abril tivemos um problema com os discos que compõem as homes dos usuários do cluster. No dia 18 um disco apresentou defeito e por um azar, logo em seguida, no dia 21 outro disco da mesma array também apresentou defeito.

Com isso o cluster teve que ser paralisado. Acabei decidindo por colocá-lo em operação o mais rápido possível, para isso, refiz um array com as homes dos usuários retirando os hds com defeito. Antes tínhamos uma array raid 5 com 6 discos e agora temos uma array raid 5 com 4 discos.

Abax no twitter!

O cluster tem uma conta no twitter agora:

@clusterabax

O site do cluster voltou

Bom se você está aqui é porque já sabe. Mas é sempre bom um aviso oficial :).

Não sei se todas as funcionalidades do site estão ok. O site não foi transferido para o servidor, ele está rodando a partir do antigo servidor na rede interna. Pra quem quiser saber como redireciona as conexões na porta 80 para outra máquina com iptables:


echo "1" >/proc/sys/net/ipv4/ip_forward
iptables -t nat -A PREROUTING -d 143.107.130.138 -p tcp --dport 80 -j DNAT --to-destination 192.168.0.100:80
iptables -t nat -A POSTROUTING -p tcp -d 192.168.0.100 --dport 80 -j MASQUERADE

Servidor novo, vida nova

Recebemos as peças para a montagem do servidor novo.

O maior impacto será no aumento do quota por usuário. Com a aquisição de 5 hds de 2TB. :)

Servidor novo, vida nova

Parada no cluster para manutenção dia 23/03

Srs. usuários.

Dia 23/03 o cluster será desligado para manutenção. É preciso rearranjar os no-breaks que alimentam o cluster para a introdução correta dos novos nós no sistema.

Áttila

*** UPDATE 23/03/10 *** O cluster já funciona normalmente. Os novos nós serão adicionados nos próximos dias.

Identificando o número de processos rodando em um Nó.

Estive pensando numa forma de distribuir meus processos de maneira mais eficiente na abax. Dai surgiu essas mal traçadas linhas. Se você utiliza scripts para distribuir seus processos nos nós, talvez os comandos abaixo sejam úteis:

contador=$(ssh [host] ps r -u [nome do usuario] | grep -c R)
if [ contador -gt 4]; then

Novo kernel dos nós

Os nós estão sendo aos poucos atualizados para a última versão estável do kernel, a versão 2.6.37. Espero que essa nova versão resolva alguns problemas como a atribuição incorreta dos jobs em relação aos cores que vem acontecendo.

Áttila

Aumentando o tamanho do histórico no bash

Muitas vezes tenho necessidade de encontrar comandos perdidos no meus histórico do bash (comando "history").

Para aumentar a quantidade de comandos guardados deve-se incluir a seguinte linha no arquivo .bashrc :

export HISTSIZE=10000

onde o número corresponde à quantidade de comandos desejado para manter guardado.

Novo sistema de back-up

Está sendo testado um novo procedimento de back-up.

O disco de responsável pela área de back-up está conectado a um dos nós, o nó ab02.

Para acessar a sua área de back-up:

(a partir do servidor abax)
ssh ab02
cd /BACKUP/home/usuario

(onde usuario é o seu login de usuario)

Se você fizer questão de ter um diretório onde você possa enxergar o seu back-up no servidor é usar (no servidor) o script

ativar-backup

Esse script monta o seu diretório de back-up no diretório /BACKUP/home/usuario do servidor usando sshfs, aliás, o comando usado no script é

Upgrade no Kernel dos nós

O Kernel dos nós foi finalmente atualizado para a última versão estável do momento, a 2.6.35.3.

Como sempre, a atualização é gradativa. Espera-se os processos dos usuários terminarem em cada nó.

Foi habilitado o suporte a utilização de discos rígidos nos nós. Isso se deve ao novo planejamento do sistema de back-up. A idéia é que um nó seja responsável pelo disco de back-up o que aumenta a segurança devido à um possível acidente com o servidor.

Áttila

Conteúdo sindicalizado