Ryzen 그룹 ProxmoxVE에서 다운되는 일.

5505 단어 proxmoxRyzen

개시하다


ProxmoxVE로 서버를 구축했지만 주기적으로 다운되었습니다.이유를 알았으니까 기사를 써.

추기


python 명령이 없어python 3이 되었습니다.ptyhon3 및 명령을 바꾸십시오.이 글에 적용된cron의 설정은 업그레이드 후에도 작용하지 않을 것이다.

기계의 구성


CPU:AMD Ryzen 5 1600 https://kakaku.com/item/K0000954888/
GPU:Geforce GTX 1050Ti https://kakaku.com/item/K0000921781/
모판: ASRock AB 350PRO 4https://kakaku.com/item/K0000947191/

장애 발생 시 상태


다운될 때의 실제 사진.

글로 아래의 내용을 깨우쳐 보아라.
login: [1192.106507] watchdog: BUG soft lockup - CPU#11 stuck for 23s [pvesr:31246]
[16.102216] watchdog: BUG soft lockup - CPU#10 stuck for 22s [kworker/10:3:6830]
[20.106166] watchdog: BUG soft lockup - CPU#11 stuck for 23s [pvesr:31246]
[44.106166] watchdog: BUG soft lockup - CPU#10 stuck for 22s [kworker/10:3:6830]
절전을 위해 C6 상태로 전환하는 경우 장애가 발생할 수 있습니다.
Ryzen linux kernel bug 196683 - Random Soft Lockup
https://community.amd.com/t5/processors/ryzen-linux-kernel-bug-196683-random-soft-lockup/td-p/156304

수정 방법


ZenState-Lnux Python 코드를 사용하면 Ryzen의 C6를 무효화할 수 있습니다.msr 모듈을 미리 사용할 필요가 있습니다.
msr 모듈 자동 불러오기
vim /etc/modules

# 中に以下を追記
msr
GiitHub에서 코드 제거
ZenStates-Linux
https://github.com/r4m0n/ZenStates-Linux
git clone https://github.com/r4m0n/ZenStates-Linux.git
현재 C6 상태를 확인합니다.C6가 효과가 있다는 것을 알고 있다.
sudo python c6_state_check/ZenStates-Linux/zenstates.py -l
P0 - Enabled - FID = 80 - DID = 8 - VID = 32 - Ratio = 32.00 - vCore = 1.23750
P1 - Enabled - FID = 8C - DID = A - VID = 50 - Ratio = 28.00 - vCore = 1.05000
P2 - Enabled - FID = 7C - DID = 10 - VID = 68 - Ratio = 15.50 - vCore = 0.90000
P3 - Disabled
P4 - Disabled
P5 - Disabled
P6 - Disabled
P7 - Disabled
C6 State - Package - Enabled
C6 State - Core - Enabled

# Proxmox7以降
sudo python3 c6_state_check/ZenStates-Linux/zenstates.py -l
C6를 무효화
sudo python c6_state_check/ZenStates-Linux/zenstates.py --c6-disable
Disabling C6 state

# Proxmox7以降
sudo python3 c6_state_check/ZenStates-Linux/zenstates.py --c6-disable
Disabling C6 state
결과를 확인하다.C6가 비활성화되었습니다.
sudo python c6_state_check/ZenStates-Linux/zenstates.py -l
P0 - Enabled - FID = 80 - DID = 8 - VID = 32 - Ratio = 32.00 - vCore = 1.23750
P1 - Enabled - FID = 8C - DID = A - VID = 50 - Ratio = 28.00 - vCore = 1.05000
P2 - Enabled - FID = 7C - DID = 10 - VID = 68 - Ratio = 15.50 - vCore = 0.90000
P3 - Disabled
P4 - Disabled
P5 - Disabled
P6 - Disabled
P7 - Disabled
C6 State - Package - Disabled
C6 State - Core - Disabled

# Proxmox7以降
sudo python3 c6_state_check/ZenStates-Linux/zenstates.py -l
완전히 예쁜 방법은 아니지만 크론에 넣고 시작할 때 설정해야 합니다.
crontab -e

# 一番最後の行に以下追記
@reboot sudo python c6_state_check/ZenStates-Linux/zenstates.py --c6-disable

# Proxmox7以降
@reboot sudo python3 c6_state_check/ZenStates-Linux/zenstates.py --c6-disable

최후


메인보드의 게 NIC는 드라이버로 불안정하기 때문에 서버가 자주 기능을 잃는다.PCI 패스스루를 진행했기 때문에 현상을 파악하기 어렵다.
게 NIC 수정된 이야기
PCI Passthrough가 실행되면 GPU(Geforce GTX1050Ti)가 가상 머신에 의해 가져갑니다.구매한 리젠은 GPU 기능이 없어 모니터가 상영할 수 없는 상태였다.
ProxmoxVE는 웹 콘솔에서 관리할 수 있을 것 같은데... NIC가 쓰러지면 어쩔 수 없어요.
아마도 GPU를 탑재한 Intel은 힘들지 않을 것입니다.

좋은 웹페이지 즐겨찾기