관심있는 이슈들

[기사] 챗GPT로 확 커지는 생성형 AI 시장...양질 데이터 중요도↑

Yuniverse. 2023. 4. 28. 16:56

https://zdnet.co.kr/view/?no=20230426003045

 

챗GPT로 확 커지는 생성형 AI 시장...양질 데이터 중요도↑

인공지능(AI) 기술의 빠른 발전으로 챗GPT와 같은 생성형 AI가 주목받으면서 AI 데이터 수요가 급증하고 있다. 세계적으로 생성형 AI 시장의 규모는 2022년 13조원...

zdnet.co.kr

기사 내용 중에 아래와 같은 인용구절이 나온다.

 "컴퓨터 업계에서는 쓰레기를 넣으면 쓰레기가 나온다(Garbage in garbage out)는 말이 있다. 좋은 데이터가 있어야 좋은 결과물이 나온다"

나 또한 데이터를 다루는 사람으로써 백보 공감되는 말이다.

 

데이터의 수량이 너무 적으면 결과가 나와도 그 결과를 신뢰하기란 어렵다. 과적합(Overfitting)이나 편향(Bias)의 문제가 생길 가능성이 커지기 때문이다.

데이터의 수량과 관계없이 오염된 데이터일 때도 큰 문제가 발생한다. 잘못된 정보들로 만들어진 결과물은 학습을 거듭할수록 더 그릇된 방향으로 발전해나갈 것이기 때문이다.

 

AI 서비스의 중요성이 커질수록 데이터 수집의 중요성도 덩달아 커질 것이기 때문에 많은 회사들이 AI 기술개발뿐만 아니라 양질의 데이터 확보에도 촉각을 곤두세우게 될 것이다.