Industrial Data Analytics Services

데이터 분석, 머신러닝 모델 구축 및 성능향상, AI 서비스 구현

1. 분석 설계

현장 전문가 인터뷰와 해당 분야의 세부 지식 습득을 통해 문제 해결을 위한 요구사항을 도출합니다. 데이터 과학자와 현업 간 효율적인 의사소통 및 협업이 요구됩니다.
비즈니스 목표와 도출된 요구사항이 정렬되도록 구조화하며, 머신러닝 활용으로 효용이 극대화 될 수 있는 부분을 판별합니다.
요구 사항이 모두 포함되는 초기 솔루션 아키텍처를 설계합니다. 초기 솔루션 아키텍처에는 데이터 처리 파이프라인, 문제 해결을 위한 가설, 활용될 머신 러닝 모델 기법이 포함됩니다.

2. 데이터 통합, 전처리

수집된 데이터를 검토하여 머신러닝 모델에 적용할 수 있도록 데이터를 평가, 선별, 정제하는 작업을 수행합니다.
다양한 형태로 분산된 레거시 데이터 구조를 통합하고, 데이터 결함 파악 및 보완 작업을 수행합니다. 이렇게 처리된 데이터는 하나의 저장소에서 통합 관리합니다.
추가 데이터가 필요한 경우, 데이터 증강 기법 활용 및 기존 데이터 간 결합으로 보완하고, 추가 데이터 수집 계획 및 수량 목표를 도출하여 제시합니다.

3. 데이터 분석, 모델링

통계적 기법 및 데이터 시각화를 통해 가설을 검증하고 보완합니다. 기본적인 데이터 간 패턴 및 상관관계를 고려하여 머신러닝 기법에 활용될 피처를 도출합니다.
문제 특성, 분야, 데이터 현황을 고려해 해당 분야에 적합한 머신러닝 기법들을 선별합니다. 모델 간 성능 비교 이후 선택된 최적 기법으로 심화 학습을 진행합니다.
목표 정확도 및 연산 속도를 얻기 위해 많은 실험을 수행하며, 반복적인 매개 변수 조정 작업이 이뤄집니다.

4. 모델검증, 적용

구축된 모델을 활용하여 실제 비즈니스 환경에서의 정량적 효과를 분석하며, 비즈니스 목표 달성 여부 및 달성 가능성을 정확하게 검토 합니다.
현장 인력 및 의사결정자에게 검증, 적용 결과가 도식화된 데이터 분석 결과 리포트를 제공하고, 문제 해결을 위해 최적화된 가이드라인을 제공합니다.
프로토타입 구축을 통해 모델의 실제 성능을 검증하고, 일반화 성능 향상을 위한 추가 보완 작업을 수행합니다.

5. 제품화

구축된 머신 러닝 모델을 레거시 응용 프로그램과 통합하여 서비스를 제공합니다. 서비스에는 데이터 파이프라인 병합이 포함되며, API 제공 또는 패키지 개발로 진행됩니다.
서비스는 필요에 따라 클라우드, 전용 서버, 모바일에서 활용할 수 있도록 패키징, 배포되며 지속적인 모델 업데이트를 수행합니다.
모델 성능 모니터링 및 데이터 품질 모니터링을 통해 전체 프로세스를 지속적으로 조율하며, 새로운 데이터, 데이터 이상 및 핵심 지표에 대한 통찰력을 제공합니다.