[미국] 시트린 인포머틱스(Citrine Informatics), 인공지능 플랫폼 스타트업의 기술 개발 20161207
세계에서 가장 규모가 큰 소재 관련 데이터 플랫폼
박동완 대기자
2024-05-19 오전 9:56:54
 
시트린 인포머틱스(Citrine Informatics)
414 Mason Street, San Francisco, CA 94102
www.citrine.io
 
 
브리핑 미국 샌프란시스코    


□ 주요내용

◇ 스탠포드 출신이 설립한 인공지능 플랫폼 스타트업


실리콘밸리에서 성공한 인공지능 플랫폼 스타트업으로 꼽히는 시트린 인포머틱스(Citrine Informatics)는 노스캐롤라이나 주립대학에서 전기공학, 캠프리지대학에서 재료공학, 스탠포드에서 MBA를 전공한 그레고리 멀홀랜드(Gregory Mulholland)가 2013년 설립했다.

재료와 컴퓨터를 연결해서 정보서비스(informatics)를 제공하는 회사로 2년 전부터 회사의 툴을 보급했다. 2010년도부터 재료공학과 컴퓨터과학의 융합을 시도했다. 정부와 연구기관들은 이전부터 어느 정도 참여를 했지만, 민간기업은 최근에야 시스템에 합류했다.

그는 재료, LED, 박막, 산화물, 태양 전지, 녹색 기술, 소프트웨어, 웹 가능 도구, 신기술, 데이터 분석, 혁신 기술 마케팅, 중소기업 전략, 그리고 고객 및 투자자 발굴, 재무에 이르는 폭넓은 연구영역과 업무역량을 가지고 있다.

시트린은 제조업체들이 방대한 데이터를 가지고 있는데, 최적의 신소재를 신속하게 찾아낼 방법은 무엇인가? 목표를 달성할 수 있도록 기존 소재 시스템을 신속하게 최적화하는 방법은 없는가? 알려진 소재에 대한 알려지지 않은 정보를 어떻게 찾아낼 것인가? 하는 문제의식을 바탕으로 이 회사가 창립되었다.

◇ 한국에서 열린 4차 산업혁명 국제심포지엄에서 발표

시트린의 창업자 중 한 사람인 더글러스 람시(Douglas Ramsey)는 오바마 대통령 밑에서 선진 제조업 분야의 투자 자문을 하는 보좌 역할을 했다.

람시는 "엔지니어로도 일을 했기 때문에 우리가 어떻게 비용을 절감하면서 빠르게 일을 효과적으로 할 수 있는지를 연구하는데 도움이 됐다"고 말했다.

이들의 연구결과는 백악관에서도 발표했고 유럽과 한국에서 열린 4차 산업혁명 국제심포지엄에서도 발표했다.
시트린의 주요 투자자는 Eric Schmidt 펀드와 Data Collective and Prelude 벤처이다.

실리콘밸리에서는 창업을 하면 투자등급을 정해 주는데 시트린은 시리즈A 등급을 받고 있다. 시트린의 자문역은 현재 나이키에 근무 중이고 미국 소재게놈 이니셔티브의 리더였으며 오바마 행정부에서 신소재에 관련된 자문역을 맡았던 사이러스 와디아(Cyrus Wadia)이다.

사이러스가 소속된 회사는 20억 달러의 정부지원금을 받았는데 시트린도 규모는 적지만 정부로부터 많은 지원을 받았다. 또한 많은 대학들이 이 회사에 학생들에게 가르칠 교과과정을 만들어달라는 요청을 하고 있다.

◇ 관련 조건에서 모든 재료 및 화학물질의 반응 예측


▲ 브리핑 중인 Greg Mulholland[출처=브레인파크]

재료, 자동차, 우주항공, 전자산업 분야에서 포브스지가 선정한 1,000대 기업에 선정되기도 한 시트린 인포머틱스는 재료 및 화학물질을 위한 인공지능, 머신러닝(기계학습기반) 플랫폼으로 특허, 논문, 보고서, 기존 데이터베이스와 같은 수많은 소스의 데이터를 수집, 분석하여 관련 조건에서 모든 재료 및 화학물질의 반응을 예측하는 'Citrination'이라는 플랫폼을 만들었다.

세계에서 가장 규모가 큰 소재 관련 데이터 플랫폼으로 전 세계의 물질적 지식을 통합하고 있으며, 인공지능 기반의 강력한 툴을 바탕으로 페인트, 강철, 자동차, 환경친화적 제품 등의 제조에 필요한 정보를 가장 빠르게 제공하고 있다.



이들은 이 플랫폼을 통해 첨단의 인공지능 기술을 제조와 재료에 어떻게 활용할 것인지를 연구하고 있다. 예를 들어 어떻게 하면 차를 가볍게 만들 것인지, 재활용 분야에서 어떻게 자연친화적으로 처리할 것인지, 도움을 주는 정보를 제공하고 있다.

시트린의 플랫폼은 인공지능을 이용한 소재 게놈(material genome)을 기업, 컨소시엄 및 연구소 등에 제공하여 제조 및 연구개발의 목표를 빠르게 달성할 수 있도록 지원하는데 시트린의 예측결과를 활용하면 R&D 및 제조 프로세스 소요시간을 50%까지 단축시킬 수 있다고 한다.



◇ 최대·최신 데이터 구축으로 빅데이터 분석

시트린 플랫폼의 기능은 크게 4가지로 구분할 수 있다. 첫째, 데이터 추출이다. 중요한 데이터가 포함된 기술문서를 구조화하고 검색 가능한 데이터베이스로 변환한다.

그림, 표, 텍스트 모두 플랫폼에 구현된다. 회사나 학회에 있는 논문 등 세계 도처에 있는 연구소에서 연구한 결과물을 플랫폼에 얹는 작업을 한다. 세계 100개 이상의 대학과 협력하고 있고 미국 11개의 국가 연구소에서도 데이터를 수집하고 있다.

둘째, 빅데이터 분석이다. 시트린의 머신러닝은 하나의 단위가 아닌 대규모 재료 및 화학 데이터를 제작, 분석하므로 제조기업의 문제 해결에 도움을 준다.

만약에 뚜껑이 병에 맞지 않는다고 했을 경우, 1,800만개 이상의 데이터를 보고 추천을 해 줄 수 있다. 엔진을 사용하면 아주 새로운 재료까지도 추출해 낼 수 있다.

셋째, 세계에서 가장 큰 물리적 데이터를 수집한다. 지금까지 1,800만 개 이상의 데이터들을 수집했다. 시트린은 세계에서 가장 방대한 재료에 관한 데이터베이스를 가지고 있다.

유저가 미래에 무엇을 할지도 파악하고 있다. 시트린은 플랫폼이 내부적으로 지식을 향상시킬 수 있도록 게시된 자료 및 화학물질 데이터를 계속해서 통합하고 있으며 그 결과 전 세계 약 2,000여개 기업, 학술기관과 정부의 신뢰를 받고 있다.

넷째, 확장 가능한 최신 데이터 인프라를 구축하고 있다. 시트린 플랫폼 자체에서 데이터 시스템 인프라를 구축하고 있으므로 이를 사용하는 기업이나 조직에서 별도의 인프라를 구축하거나 IT 문제를 겪을 필요가 없다.

◇ 시트린의 데이터 분석에서 제공까지 과정

시트린의 데이터 분석에서 제공까지의 과정은 다음과 같다. 먼저 데이터 처리(ingest data)를 한 다음, ML 모델 교육(Train ML models)을 하고, 모델과 최적화기를 투입(Deploy models & optimizers)한다.

이어 사용자 대상 R&D와 제조업 관련 조언(guide user R&D and mfg.)을 하고, 사용자가 더 많은 정보를 창출할 수 있도록 지원(user generate more data)을 하는 과정을 거치는 것이다.

◇ 소재 정보학이라는 새로운 지평 개척


시트린은 소재 정보학이라는 새로운 지평을 개척한 회사로 평가받고 있다. 거의 모든 연구가 대학, 정부산하 연구소에서 진행되고 있지만 그동안 소재 정보학 관련 프로젝트를 기업 내에서 성공적으로 진행한 기업은 거의 없었다.

주요 인프라와 훈련 장벽이 존재했다. 시트린이 소재정보학 관련 상품을 출시한 유일한 기업이며 상업적인 면에서도 세계적인 선도기업이다.

시트린은 2016년에 세계 MGI 컨퍼런스와 백악관 MIG를 조직했다. 시트린 덕분에 2016년은 소재관련 글로벌 커뮤니티가 연결되고 통합되기 시작한 해로 기록될 것이다.

소재 정보학의 응용분야는 열전기학(Thermoelectric), 적층가공(Additive Manufacturing), 밧데리, 이온 전도체, 자기열량(Magnetocalorics) 등이다.


▲ 소재정보의 성장 추이도[출처=브레인파크]

◇ 재료 성능 예측 데이터 분석으로 R&D시간 단축

시트린의 플랫폼을 이용하는 대상별로 플랫폼을 통해 얻을 수 있는 장점을 살펴보면, R&D과학자 및 엔지니어는 제품디자인(설계) 단계에서 후보 재료가 어떤 조건에서 어떻게 작용하는지를 즉시 알 수 있고, 새로운 재료 및 화학물질의 성능을 예측하고 동시에 수십 가지의 특성을 최적화시킬 수 있다.

생산관리자는 과거 생산데이터를 분석하여 공정을 변화시켰을 때 제품의 노후화, 오류에 미치는 영향을 분석해낼 수 있고, 결함을 관리할 수 있다.

자재 판매 및 고객 담당자는 고객의 요구사항과 제품의 연관성을 분석하거나 잠재고객이 구매 결정을 내리는데 필요한 정보들을 파악해볼 수 있다.

시트린의 주요 파트너로는 △포춘지 선정 도금산업 200대 기업 △제너럴모터스, 보잉사, 현대, 파나소닉, 큐테크 등 700여개 제조기업 △DARPA(미국 방위고등연구계획국), 미 연방 에너지부, 과학재단 등 정부기관 △Elsevier 저널 △스탠포드대학, 메릴랜드대학, 산타바바라대학, 버클리대학, 노스웨스턴 대학 등이 있다. 대부분의 고객은 비밀로 되어 있는데 공개할 수 있는 것은 몇 개 정도이다. 주로 재료와 페인팅 쪽 회사의 일을 많이 했다.

◇ 소재 정보학 분야의 시트린의 증명된 리더쉽

시트린은 50회의 논문발표, 토론회에 초대받았고 다양한 저술에서 인용되었고 APL Material지의 소재 게놈편 논문에 게재됐다.

시트린이 최근 참여한 이벤트로는 '주요 소재에 대한 EU-US-일본 삼자 컨퍼런스'가 있으며 주요 IT 관련 컨설팅 회사 Gartner가 시트린을 5대 제조 관련 R&D 기업으로 선정하기도 했다.


▲ 시트린의 주요 고객[출처=브레인파크]

스탠포드 경영대학원은 "시트린 빅데이터를 소재 개발에 이용했다"며 혁신을 주제로 한 잡지에서 시트린을 주목하기도 했다.

APL Material은 "소재 관련 데이터 자원의 집중화에 괄목할 만한 진전을 이룬 유일한 조직이 시트린 인포메틱스이고, 소재 개발과 최적화를 위한 데이터 마이닝에 전문성을 가지고 있다."고 소개했다.

◇ 그동안 연구되지 않았던 원소 집중 연구


시트린이 실시한 최초의 프로젝트는 화학의 원소표를 모두 체크해 가면서 그동안 많은 연구가 되지 않았던 원소를 집중적으로 연구하는 것이었다.

그런데 시트린의 소프트웨어에 과학자들이 어떤 부분에 집중하는지 대입을 해 보았더니 소프트웨어가 별모양으로 되어있는 원소를 찾아 주었다.

연구원은 이것을 믿지 않았지만 실제 만들어 보니 소프트웨어가 맞았다는 것을 알게 됐다. 이것이 소프트웨어가 개발한 전혀 새로운 원소였다.

또 다른 사례로 3D프린팅을 들 수 있다. 다국적 기업과 협업을 했는데, 대표적인 회사가 록히드 마틴이었다. 또 다른 예는 차세대 전기자동차에 들어가는 배터리이다. 시트린은 시카고에 있는 알곤이라는 국립 연구소와 공동으로 배터리 연구를 하고 있다.

이온 전도체(ionic conductor)는 미국 에너지부와 공동으로 진행하는 프로젝트이다. 그런데 순식간에 Oxygen Conductor라고 하는 부분에서 세계 최고의 데이터베이스를 구축했다. 이는 미국정부가 가지고 있는 것보다 큰 것이다.

다음 사례는 Magnetocalorics라고 하는 것으로 17개 국립 연구소에서 데이터를 입수한 신규 프로젝트이다. 시트린은 데이터베이스와 툴을 구축하고 있는데, 협업을 하는 회사 중 하나가 유나이티드 테크놀리지라는 회사이다. 

□ 질의응답

- 소프트웨어가 전혀 새로운 원소를 찾아냈다고 했는데, 알파고가 전혀 엉뚱한 수를 둔 것과 비슷한 원리인지.

"알파고는 엄청난 양의 데이터에 접근할 수 있는 능력을 가지고 있었다. 우리가 만든 소프트웨어가 그런 역할을 할 수 있다. 알파고와 비슷하지만 알파고는 엄청난 데이터를 가지고 있지만 시트린의 소프트웨어는 데이터가 적어도 이런 결과를 낼 수 있다는 점이다."

- 아까 발표했던 선순환(Virtuous Cycle)에 따르면, 고객들과 빠르게 실시간으로 소통하는 것이 가능하다고 했는데, 전 세계의 사용자와 고객들 모두에게 가능한 것인지.

"그렇다. 전 세계 어디서나 실시간으로 소통이 가능하다. 알파고는 새로운 게임을 할 때마다 스스로 자기학습을 해서 능력을 키운다.

알파고가 게임을 많이 하는 훈련이 리얼타임 학습이다. 우리는 국립 연구원이나 대학교와 연계를 통해 재료공학의 재질과 물성에 관한 1,800만 개의 데이터베이스를 보유하고 있다."

- 연구소들이 실시간으로 연구 결과를 제출해 주어야 하는데, 이런 분들이 이 소프트회사로부터 받는 것이 있어야 제출을 할 것 아닌가? 어떤 인센티브가 있는지.

"어떤 곳과 계약을 맺고 있어 데이터베이스를 전송해 줄 의무가 있다. 상당수의 회사들이 자사의 데이터베이스를 여러 군데 저장하는 것보다 우리 같은 회사 1개에 전송하는 것이 편리하기 때문에 데이터 수집은 그리 어렵지 않다.

알파고와 연계해서 말씀드리면 10년전 왓슨 컴퓨터가 체스 챔피언을 이겼다. 지금도 체스경기가 열리지만, 우리는 연구자와 기계가 협업을 하자는 것이지, 누가 이기느냐 하는 게임을 하는 것이 아니다. 컴퓨터와 사람이 협업을 하면 뛰어난 천재를 이길 수 있다.

우리는 사람들에게 직업을 더 만들어주는 것이 목표이다. 적절한 역할을 컴퓨터가 수행하지만 그것을 조종할 수 있는 업무를 사람들에게 주는 것이 우리들이 추구하는 바이다."

- 주기율표에서 무엇을 연구하려고 하다가 새로운 원소를 만들어내게 된 것인지.

"처음 연구원들이 주기율표를 들여다보고 있을 때는 학계와 공동으로 일을 하고 있었다. 우리는 가운데 있는 원소들하고 조금 특성이 다른 원소가 있는지 알아보려고 한 것인데, 이 과정에서 우리가 생각했던 것이 아닌 새로운 원소를 소프트웨어가 찾아준 것이다."

- 열전도성이 높은 원소를 찾고 있었던 것인지.

"우리가 찾으려고 했던 것은 열전도성은 높지만 상수는 낮은 것을 찾으려고 했는데, 소프트웨어가 이상한 것을 찾아 준 것이다."

- 누군가 연구를 했던 결과물이기 때문이 아닌지.

"서로 조합을 해서 나올 수 있는 것이기 때문에 이런 결과가 나온 것이지 연구 결과물이 있어서 그런 것이 아니다."

- 리튬을 대체할 수 있는 연구도 가능할 것 같은데.

"원소에 대해 더 많은 연구를 할 예정인데, 그런 것을 하기 위해서는 재료 연구와 같은 엄청난 자료가 필요하다. 우리가 가장 중요한 원소를 대체하는 것에 대해 연구하고 있는데, 리튬은 거기에 아직 속하지 않는다.

인디움 같은 원소는 대체하려고 노력하고 있다. 리튬은 부피가 큰데, 이것을 우리가 들여다보고 있는지 없는지는 알아서 생각하기 바란다.

한 가지 덧붙이고 싶은 것은 재료 쪽의 도전적인 과제는 최고의 퍼포먼스를 얻는 것이 최종 목적은 아니라 비용을 절감하는 것이다. 주로 과학자들은 비용을 생각하지 않는데, 우리는 비용과 효과를 함께 생각한다."

- 기초 데이터가 숫자 개념인지 텍스트 마이닝이 필요한 데이터인지? 연구실마다 기초 데이터의 타입이 모두 다를텐데 어떻게 정리를 하는지, 데이터가 연구실마다 다르게 나타날 수 있을 텐데.

"주로 우리는 숫자로 된 데이터를 사용한다. 가끔 텍스트로부터 데이터의 숫자를 추출해서 입력한다. 주로 하지 않는 텍스트는 '철강은 반짝거리고 강하다'라고 할 때 세부적으로 묘사하는 것이 아니라 숫자를 연결시키려고 노력하고 있는 것이다.

우리는 뛰어난 퀼리티 데이터 문제를 해결하려고 노력한다. 예를 들어 두 개의 국립연구원에서 좋다는 데이터를 받아보았는데 가치가 다르다면 다른 이유가 있을 것이다.

이런 경우에 메타 데이터가 있었는지 실험방법 등을 연구하게 된다. 저와 동료가 연구를 했을 때 동료가 한 것이 좋았다면 제 것을 버리는 것이다.

어떤 실험을 하기 전에 AI가 이 정도 수준의 데이터가 나올 것이라고 예측을 했을 때 맞으면 선택하고 맞지 않으면 버리는 것이다.

여기서 말하는 것은 데이터를 정상화한다고 말하는데, 데이터가 좋든 나쁘든 데이터를 조작하지는 않는다. 나쁘면 버리는 것이지 좋게 만들지는 않는다."

- 시트린은 소프트웨어 회사인데, 새로운 소재를 발견했으면 실현시키기 위한 테스트는.

"시트린은 소프트웨어 회사라 테스트는 하지 않는다. 우리는 소프트웨어를 대규모의 재료와 관련된 회사에 판매를 한다. 소프트웨어를 사간 사람들이 우리 회사의 지적 재산권을 갖게 되고, 고객들이 스스로 실험을 하게 되는 것이다."

- 예측한 결과를 실제로 실험을 했을 때 성공비율은.

"성공률은 측정하지 않는다. 고객사가 가져가서 자체적으로 테스트를 하는 것은 그쪽의 일이기 때문이다. 합성수지 폴리머에 대한 실제 케이스를 보자. 데이터를 갖고 모델링을 하고, 옵티마이즈를 하고 디자인을 한다.

대충 1분 내로 알려주는데 물론 소프트웨어가 알려주는 것은 가설적인 것이기는 하지만 이것을 가져간 고객사에서는 과학자가 이런 내용을 보고 자기의 데이터를 입력해서 만들어보는 것이다."

- 모든 소프트웨어는 버그가 있는데 어떻게 발견하고 디버깅을 어떻게 하느지.

"소프트웨어에는 두 가지 종류의 버그가 있다. 첫 번째는 디스플레이상의 버그가 있는데 이를 방지하기 위해 표준화된 테스팅을 하고 있다.

두 번째 버그는 모델링을 해놨는데 엉터리였을 때 표준화된 AI테스트를 확인한다. 신규데이터가 들어왔을 때 고객사가 데이터 변경을 할 때 마다 돌려 확인하면 모델링이 얼마나 잘되고 있는지를 알 수 있다.

그런 결과 초기에는 AI버그가 상당히 많았는데 고객사들은 시트린의 소프트웨어에서 AI버그를 거의 발견하지 못하고 있다."

- 이번 창업이 몇 번째인지, 창업시 힘들었던 점, 실리콘밸리의 학교나 기관에서의 지원을 받았던 경험은.

"시트린은 처음으로 창업한 회사이다. 회사를 만들었을 때 가장 어려웠던 점은 아이디어를 어떻게 하면 사람들이 사용할 수 있는 소프트웨어로 만들 수 있을까 하는 것이었다.

실리콘밸리에는 뛰어난 아이디어들이 많이 나오지만 다 성공할 수 없다. 너무 뛰어나면 사람들이 많으면 모두 받아들일 수 없기 때문에 그 아이디어를 구체화시키는 것이 가장 어려웠다.

창업을 하려면 VC에 가서 돈을 달라고 해야 하는데, 세 가지 질문에 대답해야 한다. 첫 번째, Technology Risk로 당신의 회사가 실제로 이것을 만들 수 있느냐?

두 번째, Market Risk로 당신의 회사가 이것을 만들었을 때 고객들이 사겠다고 생각했는가? 세 번째 질문 Execution Risk로 당신의 팀이 이것을 실행할 준비가 되어 있는가? 이다."

- 두 번째 질문에 대해 어떻게 대답했는지.

"우리끼리도 매일 세 가지 질문에 대답을 하고 있는데, Market Risk에 대한 질문이 제일 어려운 질문이었다. 벤처캐피탈들은 재질에 관련된 분야는 많이 알고 있기 때문에, 이런 제품을 여러 군데 다니면서 많이 팔아 보면 사람들이 많이 산다고 하니 돈을 지원해주겠다고 한다."

- 교과과정도 만들었다고 하는데, 어떤 과정을 만들었고 어떤 방식으로 만들었는지.

"대학에서 교과과정을 개발해달라고 요청이 들어오지만 실제로는 개발한 과정이 많지는 않다. 대신 대학과 학생들과 협업을 통해 그들이 필요한 혁신적인 기술을 개발하는데 동참을 하고 있다.

특히 화학, 재료과학, 컴퓨터 과학이 겹치는 분야에 대해서 주로 많이 한다. 예를 들어 요즘은 재료과학자들이 전부 코딩을 할 수 있는 능력이 있고 코딩하는 사람들도 다른 분야를 알고 있다. 이렇게 중첩되는 부분에 대해 주로 자문과 교재개발을 하고 있다."

- 실리콘밸리의 반도체 기판에 대해서도 이제 한계가 온 것 같은데, 다른 재료를 찾아내는데 관심이 없나? 트리즈 기법이라고 수많은 특허를 분석해서 과학적으로 해법을 찾아내는 방법에 대해 알고 있는지.

"개인적으로 반도체 업계에 종사했지만, 갈륨이 실리콘웨이퍼(siliconwafer)를 대체할 것으로 생각하지는 않다. 갈륨은 고주파칩에 활용할 수 있는 특성이 있고, 실리콘은 다른 특성이 있다.

러시아의 트리즈 기법에 대해서는 잘 모르지만 미국에도 유사한 것을 제공하는 기업이 있다. 제 생각에는 특허를 분석해서 방향 제시를 하는 것은 매우 유용한 것이지만 특허를 이렇게 제작하라고 지시하는 것은 말이 안된다.

특허는 워낙 광범위한 크레임을 가지고 있기 때문이다. 현재 미국 내에 특허와 관련되어 있는 소프트웨어는 어떤 식으로 사용하느냐하는 내용은 다른 곳에 이미 나와 있다. 그 정도 수준에서 사용하고 있다."

- 창업을 하면서 가장 주저했던 점과 창업 동기? 전체 직원들이 몇 명인지.

"이쪽에서 연구를 하다 보니 데이터가 너무 많고 분석하기가 쉽지 않다는 생각을 하고 있는데 공동창업자가 그런 솔루션을 가지고 있었다.

우리끼리 프로젝트를 진행하면서 서로 이야기를 하다 보니 어느 순간 뭔가 손에 들어왔다는 느낌이 들었을 때 창업을 하게 된 것이다.

창업을 해서 지금도 안고 있는 어려움은 초창기 창업을 3명이서 했을 때는 아무 문제가 없었는데 지금은 직원들이 많아져 부하직원의 가족까지 책임져야 하는 것이다. 제가 내린 결론 때문에 직원들에게 월급을 주지 못하는 경우가 생길까 걱정이다. 직원들은 모두 21명이다"

- 직원들의 전공은.

"컴퓨터과학자, 재료공학, 인사 등 행정이 각각 3분의 1이다."

- 내가 자동차 회사 대표로서 고객이라 생각하고 무엇을 받고 무엇을 줄 수 있는지 말해 달라. 그러면 시트린이 하는 일이 쉽게 이해가 갈 것 같다.

"내가 소속되어 있던 회사는 금속 회사였는데 신규 금속을 찾아야 하는 상황이 됐다. 예를 들어 트럭을 제작할 때 중량을 감량시킬 수 있는 재질을 찾아봤다.

내가 일했던 회사는 연구원 500명이 있었고 통상 10년에서 20년 정도 발명 사이클을 가지고 있었다. 그런데 시트린 같은 회사에 동참하면서 10년 사이클을 5년으로 줄일 수 있을까를 고민하기 시작했다.

컴퓨터와 연구원을 연결해 주면서 기술주기를 단축할 수 있었다. 예를 들면 미국의 S150라는 재질이 알루미늄인 트럭이 있는데 이 트럭의 발명에서 구상까지 15년이 걸렸다.

그런데 3년 이내로 줄일 수 있다면 경쟁사 까지 포함해서 구도를 모두 바꿀 수 있게 되는 것이다. 통상적으로 고객사는 현금을 주고 소프트웨어를 사가고, 자사의 데이터를 입력한다.

그러면 우리는 그것을 가져다가 데이터를 입력해서 소프트웨어 툴을 전달해 주면 된다. 예를 들면, 현대자동차는 연구원만 2만 명이나 있는 것으로 알고 다.

연구원들의 작성물에는 특허도 있고 기업비밀도 있을 것이다. 우리가 특허나 기업비밀을 수집해서 하나의 데이터베이스에 수록하고 엔진을 만들어 주면, 현대와 우리 사이에 피드백이 진행이 되는 것이다."

- 구매로 끝나는 것이 아니라 어떤 기간 동안은 계약 관계가 성립하는 것인지.

"고객사와 우리의 협업이 이뤄지는 것이다."

- 가격이 제일 싼 것은.

"일 년에 제일 싼 것은 15만 달러에서 20만 달러이다. 물론 우리가 계약은 통상적으로 3년 단위로 하고 있다."

- 시트린이 추구하는 동종업계의 차별화 전략과 추구하는 가치는.

"새로운 재료를 개발해서 제품화하는데 걸리는 시간을 줄여주자는 것이고, 에너지 문제와 자원문제 해결에도 도움을 주자는 것이다.

다른 회사와 차별화하는 전략은 딥 마인드는 상당히 얕고 광범위하게 하는 반면, 우리는 한 분야에서 매우 깊이 있게 들어가는 것이 가장 큰 차이점이다. 재료에 관한 방대한 데이터가 있는데, 시트린 만이 방대한 데이터를 전부 취급해서 솔루션을 제공할 수 있다."

- AI분야에서 공인된 효율적인 테스트를 위해 회사끼리 협력이나 회사와 정부와의 협력이 이루어지는지

"정부와 회사가 협업하는 것은 없고 우리가 자체적으로 AI테스트를 만들어냈다. AI테스트는 AI시스템 내에서 발생하는 에러를 확인하는 것으로 우리가 자체적으로 가지고 있는 수학적인 스탠다드 테스트이며 5,6가지 방법으로 하고 있다. 나중에는 공인된 테스트 기관이 나올 수도 있겠지만 현재는 없다."

- AI가 4차 산업혁명에 기여한 역할은.

"지금 4차 산업이라고 하는 것은 두 가지 전제가 놓여 있다. 가장 기본은 과거에 볼 수 없었던 방대한 양의 데이터를 수집하는 것이고 또 한 번도 해 보지 않은 방법으로 데이터를 분석하는 것이다.

4차 산업이라는 단어가 정의가 되었을 때는 광범위한 데이터를 수집하는 쪽에 국한되었는데, 지금은 그것을 훨씬 넘어서는 영역으로 넘어갔다.

데이터를 수집하는 것은 쉽지만 데이터를 가지고 어떤 의미 있는 것을 창출해내느냐 하는 것이 어려운 과제가 되는 것이다. 백악관과 일을 할 때 각 업계한테 데이터를 취급하는 툴을 도입하라고 한 적이 있다.

데이터가 사용가능한 데이터여야 하고 인간이 분석을 할 수 있어야 한다. 디바이스가 발전하고 데이터가 우수하면 경쟁할 수 있다."

- 미국도 데이터 과학자가 많이 모자라는지, 데이터 과학자나 분석가들을 기업에서 자체적으로 양성을 하게 되면 기업의 전망이 어떻게 될 것 같은데.

"지금 미국에서는 데이터 과학자라고 하면, 두 단계로 나눈다. 상위는 쉽게 말하면 우리 회사에서 근무하는 직원들이고, 알고리즘 개발자인데, 현재 이들의 수는 많지 않다.

두 번째 하위 단계의 데이터과학자들은 고객사에서 툴을 사용하는 사람들인데 2~3년 전에는 그 수가 적었지만 지금은 많이 늘어났고, 5년 후에는 더 늘어날 것이다.

현재 미국에서는 빅데이터와 관련된 상당히 많은 트레이닝이 진행되고 있다. 지금 우리 회사에는 상당히 많은 숫자의 데이터 과학자들이 있다.

미국에서 고객이 될 가능성이 있는 회사들은 자체적으로 분석을 하려 않기 때문에 기업에서 데이터 분석가들을 많이 고용하더라도 우리 회사는 미치는 영향은 없다.

오히려 데이터에 대한 이해도가 깊어져 사업이 더 잘 될 수 있을 것이라 생각한다. 우리는 기술, 소프트웨어, AI툴 모두 가지고 있다. 이제 업계에서 이것을 받아들여야 하는 상황에 온 것이다.

그런데 5년 정도 후면 미국 대기업들은 자체적으로 AI를 도입하게 될 것이다. 제트기 엔진을 만드는 GE는 AI를 활용할 계획을 수립해 두었다. 많은 회사들이 시도를 할 것이다. 하지만 좋은 데이터 과학자가 없으면 실패를 거듭하게 될 것이다."

- AI분야에 있어서 정부의 역할은.

"첫째, AI 인프라를 개발할 수 있는 기회를 많이 제공해야 한다. 복잡한 AI는 클라우드 상에서 돌게 되는데, 한국은 6, 7% 기업이 클라우드를 쓰고 있고 미국은 70% 정도가 쓰고있다.

한국 정부가 클라우드 쪽으로 가도록 해주면 크게 도움이 될 것이라고 생각한다. 둘째, 정부 입장에서 국민들에게 AI의 공포심을 없애 주는데도 노력해야 한다.

많은 사람들이 AI가 등장하면 직업이 사라질 공포감을 가지고 있는데 사람들의 직무를 바꿔줄 뿐, 많은 영향은 없다고 본다. 국민들이 AI를 수용할 수 있도록 분위기를 바꿔주는 것이 정부의 역할이다."

- 한국의 AI이용률이 낮은 것이 보안문제라고 보는지.

"AI 자체의 문제라기보다는 클라우드 상에서는 보안이 취약하다는 생각 때문이다. 지금 정부의 역할에 대해 보완하고 싶은 것은 대기업인 경우는 어느 정도 받아들일 준비가 되어 있다고 보지만 미국에서도 중소기업은 녹록하지 않은 현실이다.

미국에서는 지방정부와 연방정부와 연합회를 구성해서 신규기술이 나오면 300여 개 도시마다 가르쳐 주는 역할을 하는데 이것이 상당히 큰 역할을 하고 있다."

- 컴퓨터공학과 재료공학을 결합해서 사업을 하고 있는데, 컴퓨터공학과 또 다른 분야를 접목할 계획은.

"현재 컴퓨터공학은 모든 분야를 다 건드리고 있다. 컴퓨터공학과 재료공학만 연계되어있다고 표현하는 것은 너무 단순화시킨 것이다.

우리 회사에는 화학공학자, 수학자도 있다. 우리가 20년 후에는 직원들의 전공이 뭐가됐든 매우 고도의 툴을 사용하는 것을 가르치고 배워서 그것으로 일을 하게 될 것이다."

- 시트린에서 재료공학 이외에 다른 분야로 확대를 하려는 계획은.

"재료공학을 벗어난 쪽은 진출할 생각이 없다. 의료는 전혀 다른 분야이기 때문에 새로 시작해야 한다. 재료공학 쪽에서 진출하지 않았던 다른 분야가 있으면 그쪽은 진출할 생각이 있다."

- 다른 회사에서 다른 분야에 집중 할 가능성이 있는지.

"할 수도 있지만, 의료분야는 매우 어렵다. 하지만 그 분야에 전문성을 가진 회사가 나중에 나올 수 있을 것이다."

- 정부가 주관하는 300여 개 도시의 중소기업을 대상으로 새로운 기술을 교육하는 프로그램이 있다고 했는데, 새로운 기술을 선정하는 기준은.

"상무부에서 300개의 도시와 회의체를 만들었는데 이것을 MEP라고 한다. 이것은 도시마다 특화된 것으로 중소기업들이 안고 있는 질문사항을 받아서 가장 적합한 기술을 가르쳐주는 것이라서 꼭 신기술이라고만 할 수는 없다.

공통적인 문제를 안고 있는 회사를 그룹으로 묶어서 그것을 해결해 줄 수 있는 신기술이 나오면 세미나나 교육을 통해 가르쳐 준다.

캘리포니아에 5개 , 펜실베니아에 2개의 MEP가 있다면 7개의 MEP들끼리 정보교환을 해서 기술 Pool을 만들고, 질의가 나왔을 때 해당되는 것을 뽑아서 가르쳐 주는 것이 기본개념이다."

- 왜 시트린이라고 회사명을 지었는지.

"시트린은 희귀한 보석이라 많은 사람들이 모조품을 만든다. 플랫폼 이름이 Citrination인데 실버를 골드로 만들 수 있다는 뜻이다."

□ 참가자 시사점

◇ 시트린 인포머틱스

○ Citrine Informatics는 재료와 소재분야의 빅데이터를 기반으로 AI를 이용하여 분석함으로써 글로벌 기업들에게 서비스를 제공하고 수익을 올리는 비즈니스 모델을 개발하여 주목받고 있는 스타트업 기업이다.

○ Citrine사가 이런 비즈니스 모델을 기반으로 스타트업을 할 수 있게 된 배경은 재료와 소재에 관한 전문가들의 연구결과와 국가 출연연구기관 및 대학 등의 방대한 연구자료가 축적되고 그것이 Big Data가 되어 이를 분석할 수 있는 SW를 개발한 것이 핵심인 것으로 보인다.

향후 사회 전 분야에 관한 각종 Big Data가 축적되고 그것을 분석할 수 있는 AI가 개발될 경우 다양한 분야에서 Citrine 유형의 스타트업 기업들이 탄생할 것이다.

○ 재료분야 맞춤형 서비스 통해 혁신적인 시간단축에 달성했다. 정부 주도형 기술개발이 아닌 기업주도형 기술개발로 경쟁을 통한 산업발전 진행 중이며 중소기업들에 정보를 제공할 수 있는 '장'을 만들어 애로사항을 해결하는 정부의 노력이 필요한 것 같다.

○ 데이터 분석 알고리즘을 어떻게 설계했는지 궁금했으며 파트너사의 요구에 얼마나 만족할 결과물을 제공하는지 파트너사의 만족도는 어떠한지 정확히 알고 싶다.

○ 넘쳐나는 Big Data 시장에서 우리 기업들은 어떠한 차별화를 가져야 할지 방안이 필요하다.

○ 재료공학과 컴퓨터 공학의 융합을 통한 정보제공 서비스를 제공하며 세계 100여개 대학 및 연구소와 협업으로 정보 수집을 하고 재료와 관련된 database를 구축했다.

○ 향후 컴퓨터 공학의 다양한 분야에 대한 적용을 통한 정보제공이 가능하고 시트린의 경우는 자신들의 강점인 재료분야에 집중할 예정이다.

○ 실리콘밸리에서 성공한 인공지능 플랫폼 스타트업으로 꼽히는 '시트린 인포머틱스'의 4차 산업혁명에 시대에 대비한 기술개발 성공사례를 충남지역의 창업을 준비하는 기업들에게 접목하여 창업 전후의 애로사항을 최소화하고 성과확산을 극대화하여 새로운 부가가치를 창출할 수 있도록 환경조성에 주력할 필요가 있다.

○ 정부는 AI 인프라 기회를 제공하여 클라우드 사용 증가를 유도하고, AI에 대한 막연한 공포심을 제거하는 분위기 조성을 해야 한다.

대기업은 받아들일 수 있지만 중소기업은 4차 산업혁명에 대비한 기술개발 수용에 어려움이 있으므로, 이에 대한 정부의 적극적인 노력과 정책 마련이 필요하다.

○ 실리콘밸리에서 성공한 인공지능 플랫폼 스타트업 회사로써 실리콘밸리에서 창업하고 성장하게 된 과정들을 들을 수 있어서 유익하였으며, 인공지능 발전을 위해서 전세계 정부와 연구기관, 산업체가 서로 기술을 공유하고 규칙을 만들어 나가야 한다고 보았다.

○ 4차 산업혁명은 여러 기술의 혁신이 통합된 거대한 물결로 여러 고급 기술이 모두 엮이고 합쳐져 기술보다 훨씬 나은 무언가가 될 수 있을 것이라는 점을 강조했다. 경직된 교육과 규제는 4차 산업혁명에 걸림돌이 될 수 있다는 점도 배웠다.

○ 실리콘밸리에서 성공할 수 있었던 스토리를 듣게 되어 유익하였으며, 특히 한국의 4차 산업혁명과 관련하여 한국의 교육수준에 비해 스킬들을 활용할 수 있는 인재들이 나오지 않는다는 점에서 시사하는 바가 컸다. 한국의 불필요한 규제가 걸림돌로 작용할 수 있다는 점도 알 수 있었다.

○ 성공한 창업가인 그레고리 멀홀랜드의 성공스토리를 들으며, 4차 산업혁명에 대처하기 위해서는 혁신형 인재를 육성하는 일이 중요하다고 생각되었다.

○ 사업체 방문을 통한 실 상황을 탐방할 수 있는 기회가 없어 아쉬웠으나 토론자의 적극적인 설명과 답변으로 유익한 시간이 되었다. 4차 산업혁명의 적용 사례를 볼 수 있었다.

○ 재료연구 분야의 빅데이터 솔루션 구축 사례, Material Science와 Computer Science의 융합이 인상 깊었다. Citrine Raw Data 수집 및 전처리 프로세스, Citrine AI 기술, 기타 국내외 컨퍼런스 발표자료 수집, 미국 Materials Genome Initiative 등이 향후 연구 주제이다.

○ 집중과 정보의 효율적 사용이 돋보이는 회사였다. 재료라는 한 분야에 대한 집중적인 자료 수집으로 수요자에 맞는 솔루션을 제공하고 있다. 아이디어는 사람들이 사용할 수 있도록 하는 것으로 시장성을 확보하는 것이 중요하다.

○ 인공지능 플랫폼을 활용하여 R&D, 제조 프로세스 소요시간을 단축시켜주는 시트린 플랫폼은 4차 산업혁명에서 집중하고 있는 빅데이터 활용, 인공지능, 기계학습기반을 모두 포함하고 있다는 점에서 흥미로웠다.

○ 재료 및 화학물질을 활용한 시트린 플랫폼을 응용하여 한국에서, 기업에서 어떤 형태로 또는 어떤 분야에서 활용할 수 있을지에 대해 고민해보는 기회가 되었다.

○ 시트린 CEO와 VP가 얘기했듯이 빅데이터를 구축하는 것이 가장 큰 경쟁력이며, 한 분야에서 시트린과 같은 빅데이터를 구축하고 활용할 수 있는 분야는 어떤 것들이 있는지, 울산지역에서 이와 같은 스타트업 기업을 만들 수 있는지에 대해 생각해보는 계기가 되었다.

○ 빅데이터를 활용하여 기존에 없었던 물질을 찾을 수 있도록 하는 시트린의 Tool이 몹시 궁금해졌다. 첫 번째 창업을 시트린으로 시작한다는 CEO의 말에서 자신감과 포부를 느낄 수 있었다.

한국과는 다르게 미국은 창업에 대한 수요가 훨씬 크고 지원 제도도 풍부한 것 같다. 청년창업에 어려움을 겪고 있는 우리나라가 선진국의 사례를 파악하여 국내실정에 맞는 정책을 펼치는 것이 중요하다고 생각한다.

○ 현재 시트린 인포머틱스는 첨단 AR기술을 활용할 제조업 분야를 찾고 있다. 예를 들어, 색을 밝게 하는 것, 철강을 더 강하게 할 수 있는 것, 차를 더 가볍게 만들 수 있는 것, 재활용을 더 할 수 있게 하는 것 등이다.

○ 또한 세계 100여개의 대학과 연계 협력하고 있으며, 해당 분야의 데이터를 수집하여 빅데이터 분석을 실시하고 있다.

시트린 인포머틱스는 많은 데이터를 분석하여 어떤 분야에 어떤 해결책을 줄 것인지에 대한 차이를 줄여준다. 이러한 일들은 대학 및 정부기관에서 주로 하였다.

현재는 시트린 인포머틱스에서 진행하고 있다. 현재 시트린 인포머틱스에 대한 투자를 받을 예정이고, 오바마 행정부의 신재료 부문을 담당하였던 자문위원을 시트린의 자문위원으로 선정할 계획이다.

○ 시트린 CEO는 아이디어를 일반인들이 사용할 수 있게 구체적으로 제품을 만들고 사업으로 이끌어 나가는 기업이라고 생각한다.

○ 실리콘밸리에서 투자를 받기 위해 필요한 요건은 크게 투자 받고자 하는 기술에 대해 설명할 수 있어야 하는 Technology Risk, 시장위험 대처에 대한 방법을 설명할 수 있어야하는 Market Risk, 실행에 대한 위험에 대처할 수 있어야 하는 Executive Risk에 대해 준비가 되어 있어야 한다는 점이 인상적이었다.

○ 재료 및 화학공학과 IT의 결합으로 통한 신사업 모델로 전통 제조업 중심의 지역기업에 시사하는 바가 크다. 스마트 팩토리외 IT융복합화에 대해 새로운 방향성 특히, 신사업 모델로써의 방향성을 고려할 만하다.

○ 신규 창업이 활발한 실리콘밸리의 장점으로 신규 사업아이디어를 창업까지 연결하는데, 절차적 어려움이 적다. 관련 내용은 별도 벤치마킹 필요해 보인다. 창업시 기술적 가능성, 시장성, 사업수행 준비상황을 검토한 후, 투자를 진행해야 할 것이다.

○ 미국의 AI 관련 정부 역할은 인프라 구성 및 AI에 대한 지나친 공포심 해소 정도로 국한하고, 민간이 자유롭게 연계할 수 있는 공간만 유지하고 있다.

하지만 이는 기술과 자본이 축적된 선진국의 논리일 수 있다. AI 기술 초기단계인 국내의 경우, 정부의 역할을 어디까지 규정해야 할지 논의가 필요하다.

○ 인공지능 플랫폼 스타트업으로 성공한 업체로 재료 및 화학물질을 위한 인공지능, 머신러닝 플랫폼으로 특허, 논문, 보고서와 같은 수많은 소스의 데이터를 분석하여 관련 조건에서의 최적의 재료 및 화학물질의 반응을 예측한다.

이를 통해 R&D 및 제조 프로세스 소요시간을 50% 이상 단축할 수 있다. 빅데이터 분석과 AI의 결합의 성공적 사례로 다룰 수 있다.

○ 벤처기업으로서 투자 유치를 위해 통과해야 하는 질문 3가지가 인상 깊었는데 1)기술적으로 가능한 것인가?(tech risk), 2) 구매할 대상이 명확한가?(market risk), 3) 실행 능력이 있는가? (Execution risk)이다.

○ 4차 산업혁명의 성격은 데이터를 수집하고 데이터를 활용하는 것이다. 정부가 해야 할 일은 AI를 가능하게 하기 위해 클라우드 서버 구축 등이 가능하도록 하드웨어는 물론 지나친 개인정보 보호로 인해 의미있는 데이터 분석에 장벽이 되는 것을 제거해야 한다.

규모가 작은 중소기업들의 경우 진입장벽이 있으므로 협의체 등을 구성해서 참여할 수 있도록 장려해야 한다.

○ 외국의 혁신기업과 국내 기업간의 데이터 공유를 통한 공동사업이 이루어지고 있으나 아직까지는 미미한 수준이다.

4차 산업혁명은 이미 진행되고 있으나 그에 비해 한국의 클라우드 도입률은 매우 낮다. 외국의 산업경쟁력 격차를 줄이기 위해서 빅데이터와 인공지능 기반의 시스템개발이 시급하다.

○ 국내에서 빅데이터 기반 검색엔진을 활용하려면 통합 플랫폼에 대한 데이터 유통 안전성 확보가 중요할 것이다. 한국의 경우 대기업조차 고객 정보 유출 및 정보오용이 잦기 때문에 시스템개발만큼 풀어야할 숙제가 될 것이다.

○ 지역 특유의 DB 구축의 필요성이 인식되었으며 지역자원, 지역정보, 지역연구 등 관련 DB구축을 통해 사업화 가능성을 시사했다.

○ AI 기반 재료분석 솔루션 서비스 등 인공지능 플랫폼 스타트업이 출현하고 있으나 미국 내에서도 AI 알고리즘 안정성에 대한 공인 프로세스는 없는 것으로 파악된다. 향후 산업이 점차 정착될 경우 기업 간, 기업과 정부 간 AI 표준에 대한 논의가 이뤄질 것으로 전망된다.
저작권자 © 파랑새, 무단전재 및 재배포 금지
카카오톡 공유 보내기 버튼
관련 기사
Special Report 분류 내의 이전기사