Published On: 1월 11일, 2023Last Updated: 1월 11일, 20230.2 min read

배경

테스트 환경에서 테스팅 엔지니어는 호스트 및 장치가 다양한 설정 요구사항에 부합할 수 있도록 지속적으로 OS와 드라이버를 업데이트합니다. 어느 1티어 급 회사의 테스트 환경에서 업데이트를 진행하기 위해 엔지니어가 오래된 장치를 물리적으로 해제 후 새로운 장치로 교체해야 했습니다. 먼저 사용 중이던 장치를 장착 해제 후 서버에 새로 설치된 GPU와 NIC 카드 드라이버 업데이트를 진행하는 것입니다.

챌린지

이러한 다중 서버 테스팅 표준 운영 절차는 시간이 너무 오래 걸립니다. 간단한 작업을 수행하기 위해 인력이 소모되고 머신 개수를 제한적으로 운용해야 합니다. 하지만 대기업에 걸맞은 프론트엔드 서비스 스케일 확장을 위해서는 이러한 제한적인 요소를 제거해야 합니다. H3는 테스트 절차의 효율을 증가시키는 것이 우선순위로 구성형 인프라 ODM을 진행하였습니다.

솔루션

테스트 절차를 간소화하기 위해 H3는 테스트 환경 구성형 인프라를 구축하였습니다. H3는 PCIe Gen 4 Falcon 4010 확장 박스 안에 있는 각 고유 장치를 풀링하여 PCIe 스위치와 NIC 카드 시스템으로 연결된 독자적인 장치 베이스로 삼아 랙이 더 크고 넓게 확장할 수 있게 만들었습니다. 더 나가 소프트웨어 솔루션은 테스트 엔지니어들이 매끄러운 플러그 연결/해제 프로세스를 수행할 수 있도록 도와줍니다. 관리 GUI 대시보드나 API를 통하여 원하는 장치 및 서버 업데이트를 수행할 수 있습니다. 이러한 구성은 관리자가 드라이버 업데이트 때문에 장치를 계속 설치하고 제거하는 번거로운 작업을 완전히 제거합니다. 또한 테스트 요구사항에 맞춰 여러 사용자가 원하는 서버 운영 체제를 선택할 수 있습니다. 예를 들어 사용자 A가 운영체제 A 환경의 호스트 2대로 GPU 4개를 사용하여 테스트를 진행하고 사용자 B가 운영체제 B 환경의 호스트 2대로 최신 NVMe 장치를 테스트할 수도 있습니다. 이러한 기능으로 테스트 표준 운영 절차 속도를 비약적으로 상승시킬 수 있어 엔지니어가 더 효율적으로 장치를 테스트할 수 있습니다.

Falcon 4010에 장착된 NIC 카드와 가속기들, 연결된 여러 서버 호스트

결과

H3가 제공한 인프라는 크게 3가지의 이점을 제공하였습니다. 첫째는 테스트 절차가 간소화된 점입니다. GUI 대시보드에서 복잡한 동시다발적 태스크를 걱정할 필요 없이 머신 상태를 직관할 수 있습니다. 둘째는 구성형 설계가 전체 테스트 환경을 확장해 더 많은 서버와 장치를 활용할 수 있는 점입니다. 이러한 변화의 의미는 회사가 주력 제품 레퍼토리를 확장시켜 더 큰 매출을 야기할 수 있는것입니다. 셋째는 시간을 절약하여 사소한 설치/해제 작업에 인력을 할애하는 대신 더 중요한 일에 사람을 투입할 수 있는 점입니다. 업그레이드된 테스트 시스템으로 인해 점유율과 효율성이 대폭 개선되었습니다. 이 기업은 H3가 ‘모든 기대에 부응했습니다’라는 평가를 남겼습니다.