[WORKSTATION 구축]뻘짓시작 - 384 GB RAM 인식오류, 부품구매
11시 쯤 눈 떠보니, 판매자에게 연락이 와 있었다.
오후 4시 정도에 30분 거리에서 직거래 가능하다는 내용이었다. 생각보다 빨리 나타난 매물에 성급한 구글링이 시작되었다.(그랬으면 안됐다)
구글링 중 몇가지 충격적인 사실을 알게 되었는데...
첫번째 내용은 최소 메모리였다.
ㅎㅎㅎ 이게 무슨...
4개의 cpu를 쓸 생각이면, 384gb 메모리를 준비하라는 데이터시트를 보고 생각에 잠겼다.
대충 견적내보니 중고 ddr4 기준으로 70만원+ 이고, 중고 ddr3로 40만원은 나올 것 같았다.
주위 전문가에게 자문을 구해보니, 채널 조건만 맞추어주면 최소 메모리를 채우지 않아도 정상 작동할 것이라는 의견이 많았다.
판매자에게 환불 규정을 여쭤보니, 해당 이유로 환불을 희망하면 환불을 진행해주겠다고 하였다. 결국 오후 4시에 Dell Poweredge R930을 구매하기로 하였다.
결정 후 OS를 알아보았는데, 곧바로 두번째 충격을 받게 되었다. 주위 it기업 대표님이 말씀하시기를... 크랙쓰다가 벌금내면 OS값 그 이상으로 뱉는다고...
그래서 정품을 알아봤는데, windows server 2022 datacenter 기준으로 cpu core 수에 맞춰서 라이센스를 구매해야한다고 한다.
88core면...1core*88... 심지어 1개도 엄청 비쌌다.
결국 우분투를 올리고, vm환경으로 윈도우를 운용하기로 하였다. 여전히 윈도우 내부에서 크랙버전 프로그램을 사용하는 것에 있어서 우려가 있지만, 2가지 해결책을 준비하였다.
1. 우분투 레벨에서 방화벽 정책을 걸어서 크랙 여부 체크 불가능하게 하기
2. 고정 ip 안쓰기
일단은 이정도 해결책을 준비해보았고, 시작하는데에는 충분하다고 판단하였다.
마지막으로 전기세를 생각해보았는데, 1100W * 4는 감당이 되지 않을 것 같았다. 자취방에 뒀다가는 소음으로 먼저 고소당하겠지만, 전기세 또한 무시 못하겠다는 생각이 들었다. 이 문제를 해결하기 위해 주위 대표님들께 전화를 걸어 사무실 한 구석을 빌릴 수 있을지 여줘보았고 적당한 위치를 찾게 되었다.
하지만... 해당 위치는 고정 ip를 여러개 받기 어려운 조건이었고, 이를 해결하기 위해 24학번으로 들어오는 네트워크 고인물에게 자문을 구하였다. 결론은 nginx를 통해서 서브도메인마다 내부 아이피를 바인딩하는 방식을 사용하기로 하였다.
여기까지 준비를 마치고, 같이 출발할 친구를 불렀는데... 계속 전화를 안받았다.
출발해야만하는 시간까지 전화를 받지 않길래, 결국 기숙사에 살고있는 다른 친구를 통해 강제 기상시킨 후 함께 거래장소로 이동하였다.
거래장소는 의외로 이런 느낌의 장소였다.
컨테이너 박스가 엄청 쌓여있었고, 컨테이너 박스 안에는 서버랙으로 차 있었다. 다른 장비들도 구경시켜주셔서 둘러보고 R930을 차에 실어주셨는데... 엄청나게 크고 무거웠다. 생각한거보다 2배는 무거웠고 들 수 없는 무게였다.
차를 옥상까지 몰고 들어왔고, 기숙사에서 카트를 빌려와서 겨우 옮길 수 있었다.
서버를 사무실에 옮겨둔 후 첫끼를 먹고, 당근마켓을 통해 필요한 케이블과 ssd 4tb, ram ddr4 ecc 256gb를 구매하였다.
ssd 나사가 없어서, 드라이버를 들고 학교에 온 나사를 다 뽑으며 찾아다닌 것을 제외하면 순조롭게 조립이 마무리 되었다.
우분투를 설치하기 위해 iodd장비에 이미지를 올려주었고 ssd에 ssd가이드를 장착하여 ssd도 마운트 해주었다.
대부분의 부품이 드라이버 없이 탈착이 가능했으며, 96개의 ram slot이 라이저카드 형태로 존재하였다.
기존에 테스트 목적으로 사용하던 스위치를 가져와서 사용하였다.
fan까지 핫스왑이 가능하였다...ㄷㄷ
모든 준비를 마치고 신나게 부팅을 시작했는데... 지옥의 시작이었다.
일단 소리가 엄청나게 컸다. 드론 이륙하는 소리가 서버에서 나기 시작했다...
그리고 이어서 lcd가 주황색으로 바뀌었다.
파워 케이블은 1개 모잘라서 빼둔게 맞았고...
램 구성은 분명...
ddr4 32gb * 4
ddr4 64gb * 4
이었는데, 128gb 만 인식되고 있었다.
이 문제를 해결하기 위해! 이제서야 ram을 공부하기 시작했다.
내가 알고있던 ram은... ddr3 -> ddr4 등의 분류 기준이 있고, 2400/3200 등 클락이 있었다. cl 같은 수치도 있었고, 서버에서는 ecc 라는 stable한 ram을 쓴다고 알고 있었다.
하지만 이게 전부가 아니었다.(전부였으면 문제가 없었겠죠)
DIMM에도 다양한 분류가 있었는데, 대표적으로 RDIMM과 LRDIMM이 있었다.
분명 데이터시트 상
이랬는데... 더 알아보니
64gb ram은 LRDIMM만 인식한다고 한다...
-> 64gb ram은 못쓴다
-> 128+256 = 384 이었는데, 256을 잃었다...
( 재당근 중 )
멘탈이 거의 나간 상태였는데, memory 384gb 조건 안맞추고도 정상 작동하는 것을 보게되어 겨우 버틸 수 있었다.
그러나 레이드 구성하다가 다시 멘탈이 나가게 되는데... 일단 오늘은 여기까지 작성
reference : https://yoonwould.tistory.com/132