11.6. Kernel
A remoção acidental do patch faz com que o enorme_page_setup_helper.py mostre erro
Um adesivo que atualiza o enorme_página_setup_helper.py script, foi removido acidentalmente. Consequentemente, após a execução do script huge_page_setup_helper.py, aparece a seguinte mensagem de erro:
SintaxeError: Parênteses em falta na chamada para "imprimir
SintaxeError: Parênteses em falta na chamada para "imprimir
Para contornar este problema, copie o enorme_página_setup_helper.py script da RHEL 8.1 e instale-o no diretório /usr/bin/:
-
Faça o download do pacote
libhugetlbfs-utils-2.21-3.el8.x86_64.rpmda mídia de instalação RHEL-8.1.0 ou do Portal do Cliente da Red Hat. Executar o comando
rpm2cpio:rpm2cpio libhugetlbfs-utils-2.21-3.el8.x86_64.rpm | cpio -D / -iduv '*/huge_page_setup_helper.py'
# rpm2cpio libhugetlbfs-utils-2.21-3.el8.x86_64.rpm | cpio -D / -iduv '*/huge_page_setup_helper.py'Copy to Clipboard Copied! Toggle word wrap Toggle overflow O comando extrai o
enorme_página_setup_helper.pyscript do RHEL 8.1 RPM e o salva no diretório/usr/bin/.
Como resultado, o enorme_página_setup_helper.py script funciona corretamente.
(BZ#1823398)
Sistemas com uma grande quantidade de experiências de memória persistente atrasam durante o processo de inicialização
Sistemas com uma grande quantidade de memória persistente levam muito tempo para arrancar porque a inicialização da memória é feita em série. Consequentemente, se houver sistemas de arquivo de memória persistente listados no arquivo /etc/fstab, o sistema pode demorar enquanto espera que os dispositivos fiquem disponíveis. Para contornar este problema, configure a opção DefaultTimeoutStartSec no arquivo /etc/systemd/system.conf para um valor suficientemente grande.
(BZ#1666538)
A KSM às vezes ignora as políticas de memória NUMA
Quando o recurso de memória compartilhada do kernel (KSM) é ativado com o parâmetro merge_across_nodes=1, o KSM ignora as políticas de memória definidas pela função mbind(), e pode fundir páginas de algumas áreas de memória com nós de Acesso Não-Uniforme à Memória (NUMA) que não correspondem às políticas.
Para contornar este problema, desative o KSM ou configure o parâmetro merge_across_nodes para 0 se estiver usando a ligação de memória NUMA com QEMU. Como resultado, as políticas de memória NUMA configuradas para a KVM VM funcionarão como esperado.
(BZ#1153521)
O núcleo de depuração não inicia no ambiente de captura de falhas no RHEL 8
Devido à natureza exigente de memória do núcleo de depuração, ocorre um problema quando o núcleo de depuração está em uso e um pânico do núcleo é desencadeado. Como conseqüência, o kernel debug não é capaz de inicializar como o kernel de captura, e em seu lugar é gerado um traço de pilha. Para contornar este problema, aumente a memória do kernel debug de acordo. Como resultado, o kernel debug arranca com sucesso no ambiente de captura de falhas.
(BZ#1659609)
zlib pode retardar uma captura de vmcore em algumas funções de compressão
O arquivo de configuração kdump usa o formato de compressão lzo(makedumpfile -l) por padrão. Ao modificar o arquivo de configuração usando o formato de compressão zlib(makedumpfile -c), é provável que ele traga um fator de compressão melhor às custas de retardar o processo de captura do vmcore. Como conseqüência, o kdump leva até quatro vezes mais tempo para capturar um vmcore com zlib, em comparação com o lzo.
Como resultado, a Red Hat recomenda o uso do lzo padrão para os casos em que a velocidade é o principal fator de condução. Entretanto, se a máquina alvo estiver com pouco espaço disponível, a zlib é uma opção melhor.
(BZ#1790635)
Uma captura vmcore falha após a operação de hot-plug de memória ou de desconectar a tomada
Após realizar a operação hot-plug ou hot-unplug de memória, o evento vem após a atualização da árvore do dispositivo que contém informações sobre o layout da memória. Assim, o utilitário makedump tenta acessar um endereço físico inexistente. O problema aparece se todas as seguintes condições forem atendidas:
- Uma variante um poucoendiana do IBM Power System executa o RHEL 8.
-
O serviço
kdumpoufadumpestá habilitado no sistema.
Consequentemente, o kernel de captura não consegue salvar o vmcore se uma falha no kernel for acionada após a operação hot-plug ou hot-unplug da memória.
Para contornar este problema, reinicie o serviço kdump após o hot-plug ou hot-unplug:
systemctl restart kdump.service
# systemctl restart kdump.service
Como resultado, o vmcore é salvo com sucesso no cenário descrito.
(BZ#1793389)
O mecanismo fadump dumping renomeia a interface da rede para kdump-<interface-name>
Ao utilizar o lixão assistido por firmwares (fadump) para capturar um vmcore e armazená-lo em uma máquina remota usando o protocolo SSH ou NFS, renomeia a interface de rede para kdump-<interface-name>. A renomeação acontece quando o <interface-name> é genérico, por exemplo, *eth#, ou net# e assim por diante. Este problema ocorre porque os scripts de captura do vmcore no disco RAM inicial (initrd) adicionam o prefixo kdump- ao nome da interface de rede para garantir a nomeação persistente. Como o mesmo initrd também é usado para uma inicialização regular, o nome da interface é alterado também para o kernel de produção.
(BZ#1745507)
O sistema entra no modo de emergência no momento da inicialização quando o fadump é ativado
O sistema entra no modo de emergência quando fadump (kdump) ou dracut o módulo squash é ativado no esquema initramfs porque o gerente systemd não consegue pegar as informações de montagem e configurar a partição LV para montar. Para contornar este problema, adicione o seguinte parâmetro de linha de comando do kernel rd.lvm.lv=<VG>/<LV> para descobrir e montar a partição LV falhada de forma apropriada. Como resultado, o sistema inicializará com sucesso no cenário descrito.
(BZ#1750278)
O uso do irqpoll causa falha na geração de vmcore
Devido a um problema existente com o driver nvme nas arquiteturas ARM de 64 bits que rodam nas plataformas de nuvem Amazon Web Services (AWS), a geração vmcore falha quando você fornece o parâmetro de linha de comando do kernel irqpoll para o primeiro kernel. Conseqüentemente, nenhum arquivo vmcore é despejado no diretório /var/crash/ após uma falha do kernel. Para contornar este problema:
-
Adicionar
irqpollà chaveKDUMP_COMMANDLINE_REMOVEno arquivo/etc/sysconfig/kdump. -
Reinicie o serviço
kdumpexecutando o comandosystemctl restart kdump.
Como resultado, espera-se que o primeiro kernel boots corretamente e o arquivo vmcore sejam capturados na falha do kernel.
Note que o serviço kdump pode usar uma quantidade significativa de memória do kernel para despejar o arquivo vmcore. Certifique-se de que o kernel de captura tenha memória suficiente disponível para o serviço de kdump.
(BZ#1654962)
O uso da memória vPMEM como alvo de despejo atrasa o processo de captura de falhas do kernel
Quando você usa a Memória Virtual Persistente (vPEM) como alvo kdump ou fadump, o módulo papr_scm é forçado a desenhar e refazer a memória com o respaldo do vPMEM e readicionar a memória em seu mapa linear. Conseqüentemente, este comportamento aciona as chamadas Hypervisor (HCalls) para o Hypervisor POWER, e o tempo total gasto, retarda consideravelmente a inicialização do kernel de captura. Portanto, recomenda-se não usar os espaços de nomes vPMEM como alvo de despejo para kdump ou fadump.
Se você precisar usar o vPMEM, para contornar este problema, execute os seguintes comandos:
Criar o arquivo
/etc/dracut.conf.d/99-pmem-workaround.confe adicionar:add_drivers =="nd_pmem nd_btt libnvdimm papr_scm
add_drivers =="nd_pmem nd_btt libnvdimm papr_scmCopy to Clipboard Copied! Toggle word wrap Toggle overflow Reconstruir o sistema de arquivo inicial do disco RAM (initrd):
touch /etc/kdump.conf systemctl restart kdump.service
# touch /etc/kdump.conf # systemctl restart kdump.serviceCopy to Clipboard Copied! Toggle word wrap Toggle overflow
(BZ#1792125)
O cão de guarda HP NMI nem sempre gera um depósito de lixo
Em certos casos, o motorista hpwdt para o cão de guarda HP NMI não é capaz de reivindicar uma interrupção não-máscara (NMI) gerada pelo temporizador HPE porque o NMI foi consumido pelo motorista perfmon.
O NMI em falta é iniciado por uma de duas condições:
- O botão Generate NMI no software de gerenciamento do servidor Lights-Out (iLO) integrado. Este botão é acionado por um usuário.
-
O cão de guarda
hpwdt. A expiração por padrão envia um NMI para o servidor.
Ambas as seqüências tipicamente ocorrem quando o sistema não responde. Em circunstâncias normais, o manipulador do NMI para estas duas situações chama a função kernel panic( ) e se configurado, o serviço kdump gera um arquivo vmcore.
Devido à falta de MNI, no entanto, o pânico no núcleo( ) não é chamado e o vmcore não é coletado.
No primeiro caso (1.), se o sistema não reagiu, ele permanece assim. Para contornar este cenário, use o botão virtual Power para reinicializar ou ligar o servidor.
No segundo caso (2.), o NMI em falta é seguido 9 segundos depois por um reset do ASR (Automated System Recovery).
A linha de servidores HPE Gen9 experimenta este problema em porcentagens de um dígito. O Gen10 em uma freqüência ainda menor.
(BZ#1602962)
O comando powersave de perfil afinado faz com que o sistema não responda
A execução do comando powersave de perfil tuned-adm leva a um estado não responsivo dos sistemas de 2-socket Penguin Valkyrie 2000 com os processadores Thunderx (CN88xx) mais antigos. Consequentemente, reinicialize o sistema para retomar o funcionamento. Para contornar este problema, evite usar o perfil powersave se seu sistema estiver de acordo com as especificações mencionadas.
(BZ#1609288)
O driver cxgb4 causa uma falha no kdump kernel
O kdump kernel quebra ao tentar salvar informações no arquivo vmcore. Conseqüentemente, o driver cxgb4 impede que o kdump kernel salve um núcleo para análise posterior. Para contornar este problema, adicione o parâmetro novmcoredd à linha de comando do kdump kernel para permitir salvar arquivos do núcleo.
(BZ#1708456)
A tentativa de adicionar a porta NIC do driver ICE a um modo 5(balance-tlb) de ligação da interface mestre pode levar a falhas
Tentar adicionar a porta NIC do driver ICE a uma interface mestre de ligação modo 5 (balance-tlb) pode levar a uma falha com um erro Master 'bond0', Slave 'ens1f0': Erro: Ens1f0": Erro: Falha no escravo. Conseqüentemente, você experimenta uma falha intermitente ao adicionar a porta NIC à interface mestre de colagem. Para solucionar este problema, tente tentar novamente adicionar a interface.
(BZ#1791664)
Anexar a Função Virtual à máquina virtual com interface tipo='hostdev' pode falhar em alguns momentos
Anexar uma função virtual (VF) a uma máquina virtual usando um arquivo .XML, seguindo o método Assignment with <interface type='hostdev'>, pode falhar em alguns momentos. Isto ocorre porque a utilização do método Assignment with <interface type='hostdev'> impede a VM de anexar a VF NIC apresentada a esta máquina virtual. Para resolver este problema, anexe a VF à VM usando o arquivo .XML, usando o método Assignment with <hostdev>. Como resultado, o comando virsh attach-device é bem sucedido sem erros. Para mais detalhes sobre a diferença entre Assignment with <hostdev> e Assignment with <interface type='hostdev'> (somente dispositivos SRIOV), veja PCI Passthrough de dispositivos de rede host.
(BZ#1792691)