Status do cluster
Enviado por attila em qui, 10/05/2012 - 11:08.Nos dias 18 e 21 de abril tivemos um problema com os discos que compõem as homes dos usuários do cluster. No dia 18 um disco apresentou defeito e por um azar, logo em seguida, no dia 21 outro disco da mesma array também apresentou defeito.
Com isso o cluster teve que ser paralisado. Acabei decidindo por colocá-lo em operação o mais rápido possível, para isso, refiz um array com as homes dos usuários retirando os hds com defeito. Antes tínhamos uma array raid 5 com 6 discos e agora temos uma array raid 5 com 4 discos.
Abax no twitter!
Enviado por attila em sex, 13/04/2012 - 18:38.O cluster tem uma conta no twitter agora:
@clusterabax
O site do cluster voltou
Enviado por attila em sex, 23/09/2011 - 17:08.Bom se você está aqui é porque já sabe. Mas é sempre bom um aviso oficial :).
Não sei se todas as funcionalidades do site estão ok. O site não foi transferido para o servidor, ele está rodando a partir do antigo servidor na rede interna. Pra quem quiser saber como redireciona as conexões na porta 80 para outra máquina com iptables:
echo "1" >/proc/sys/net/ipv4/ip_forward
iptables -t nat -A PREROUTING -d 143.107.130.138 -p tcp --dport 80 -j DNAT --to-destination 192.168.0.100:80
iptables -t nat -A POSTROUTING -p tcp -d 192.168.0.100 --dport 80 -j MASQUERADE
Servidor novo, vida nova
Enviado por attila em qua, 23/03/2011 - 14:48.Recebemos as peças para a montagem do servidor novo.
O maior impacto será no aumento do quota por usuário. Com a aquisição de 5 hds de 2TB. :)
![]()
Parada no cluster para manutenção dia 23/03
Enviado por attila em qui, 17/03/2011 - 16:23.Srs. usuários.
Dia 23/03 o cluster será desligado para manutenção. É preciso rearranjar os no-breaks que alimentam o cluster para a introdução correta dos novos nós no sistema.
Áttila
*** UPDATE 23/03/10 *** O cluster já funciona normalmente. Os novos nós serão adicionados nos próximos dias.
Identificando o número de processos rodando em um Nó.
Enviado por amtramos em ter, 08/02/2011 - 20:53.Estive pensando numa forma de distribuir meus processos de maneira mais eficiente na abax. Dai surgiu essas mal traçadas linhas. Se você utiliza scripts para distribuir seus processos nos nós, talvez os comandos abaixo sejam úteis:
contador=$(ssh [host] ps r -u [nome do usuario] | grep -c R)
if [ contador -gt 4]; then
Novo kernel dos nós
Enviado por attila em qua, 12/01/2011 - 23:59.Os nós estão sendo aos poucos atualizados para a última versão estável do kernel, a versão 2.6.37. Espero que essa nova versão resolva alguns problemas como a atribuição incorreta dos jobs em relação aos cores que vem acontecendo.
Áttila
Aumentando o tamanho do histórico no bash
Enviado por attila em ter, 05/10/2010 - 20:13.Muitas vezes tenho necessidade de encontrar comandos perdidos no meus histórico do bash (comando "history").
Para aumentar a quantidade de comandos guardados deve-se incluir a seguinte linha no arquivo .bashrc :
export HISTSIZE=10000
onde o número corresponde à quantidade de comandos desejado para manter guardado.
Novo sistema de back-up
Enviado por attila em ter, 24/08/2010 - 17:14.Está sendo testado um novo procedimento de back-up.
O disco de responsável pela área de back-up está conectado a um dos nós, o nó ab02.
Para acessar a sua área de back-up:
(a partir do servidor abax)
ssh ab02
cd /BACKUP/home/usuario
(onde usuario é o seu login de usuario)
Se você fizer questão de ter um diretório onde você possa enxergar o seu back-up no servidor é usar (no servidor) o script
ativar-backup
Esse script monta o seu diretório de back-up no diretório /BACKUP/home/usuario do servidor usando sshfs, aliás, o comando usado no script é
Upgrade no Kernel dos nós
Enviado por attila em seg, 23/08/2010 - 18:35.O Kernel dos nós foi finalmente atualizado para a última versão estável do momento, a 2.6.35.3.
Como sempre, a atualização é gradativa. Espera-se os processos dos usuários terminarem em cada nó.
Foi habilitado o suporte a utilização de discos rígidos nos nós. Isso se deve ao novo planejamento do sistema de back-up. A idéia é que um nó seja responsável pelo disco de back-up o que aumenta a segurança devido à um possível acidente com o servidor.
Áttila
