원제: " 자오창펑 (CZ) 중국 전문대생의 교육 에이전트가 되기 위한 창업 자금으로 1,100만 달러를 투자했습니다 ."
원저자: GeekPark 산하 기업가 커뮤니티 Founder Park
대학 3학년 중국인이 창업 자금으로 1,100만 달러를 모금했는데, 이는 실리콘 밸리에서 지금까지 가장 많은 융자 학생 스타트업이 되었습니다.
사용자가 단 한 문장으로 개인화된 교육/설명 비디오를 제작할 수 있는 K-12 학교용 교육 에이전트 제품인 비디오튜터(VideoTutor)가 오늘 1,100만 달러 규모 융자 완료했다고 발표했습니다. 이번 융자 는 YZi Labs가 주도했으며, 바이두 벤처스(Baidu Ventures), 진추 펀드(Jinqiu Fund), 아미노 캐피털(Amino Capital), 브리지원 캐피털(BridgeOne Capital)을 비롯한 여러 유명 투자자들이 참여했습니다.
이는 YZi Labs가 투자한 최초의 AI 제품 회사이기도 합니다.
창업자 카이 자오는 VideoTutor가 CZ와 YZi Labs의 투자팀으로부터 인정과 지원을 받았으며, YZi Labs가 이번 융자 주도했다고 밝혔습니다. YZi Labs는 10개 이상의 투자 텀시트(Term Sheet, TS)를 받았고, 최종적으로 이 중 몇 개를 선정했습니다.
이 제품의 첫 번째 버전은 5월 14일(Founder Park 제품 마켓플레이스에서 처음 출시) 출시되었으며, 시장에서 인정받고 PMF의 검증을 받았습니다. 5개월도 채 되지 않아 1,100만 달러 규모의 시드 융자 완료했습니다.
카이의 견해로는, 그들이 이러한 융자 확보할 수 있었던 핵심적인 이유는 "Little Genius Team"이 올바른 방향을 제시하고 시각적 학습 방법을 사용하여 K-12 부문의 미국 대학 입시 준비의 문제점을 해결했기 때문입니다.
"이 분야는 젊은 세대에게 더 적합하며, 뛰어난 엔지니어링 기술을 갖추고 있고, 창업자는 매우 뛰어난 통찰력과 경험을 가지고 있으며, 실행이 매우 빠릅니다."
이런 기업은 그들뿐만이 아닙니다. Cursor, Mercor, Pika, GPTZero를 비롯한 많은 실리콘 밸리 대학생들이 잇따라 새로운 융자 세우고 있는 AI 제품을 통해 AI 기업가 정신에 대한 모든 사람의 이해를 새롭게 정의하고 있습니다.
AI 시대에 사업을 시작하는 것은 정말 다릅니다.
우리는 VideoTutor의 젊은이들과 인터뷰를 통해 그들이 어떻게 이 시드 융자 확보할 수 있었는지, 오늘날 실리콘 밸리 스타트업에서 어떤 변화가 일어나고 있는지, 그리고 왜 그들이 중국 대기업의 직원을 고용하는 데 그렇게 열심인지 알아보았습니다.
인터뷰 대상자: CEO 카이 자오, CTO 제임스 잔.
인터뷰 & 편집 | 완후
다음은 창립자 박씨가 편집하고 정리한 인터뷰 내용입니다.

K-12 교육 부문에서는 시각적 학습이 진정한 방향입니다.
박창립자: 많은 단체들이 당신에 대해 긍정적인 평가를 내리고 있습니다. 그들에게 깊은 인상을 준 핵심 요소는 무엇이라고 생각하십니까?
Kai: 가장 중요한 것은 우리가 올바른 방향으로 나아가고 있다는 것입니다. AI 교육 분야는 엄청난 잠재력과 밝은 미래를 가지고 있습니다. 저희는 미국 대학 입시, 특히 SAT와 AP 시험 교육 분야에 진출했습니다. 저희의 타겟 사용자 그룹은 K-12 고등학생이며, 저희와 이 사용자 그룹 간의 격차는 매우 작아서 사실상 세대 차이가 없습니다. 저희는 시험 준비 및 학습 과정 전체를 경험했고, 시험 및 시험 준비 과정에서 어려움을 겪는 부분이 어디인지 정확히 알고 있기 때문에 이 그룹의 어려움을 진정으로 해소해 줄 제품을 만들 수 있습니다.
둘째, 팀이 훌륭합니다. 제임스는 제미니 출신으로 구글에서 핵심 AI 엔지니어이자 알고리즘 전문가로 일했습니다. 저는 세 번의 교육 스타트업 경험을 가지고 있는데, 대학 1학년 때 교육용 소프트웨어 개발에 참여했고, 2학년 때는 MathGPTPro 개발에 참여하여 Miracle Innovation Forum 등에서 선정되기도 했습니다. 교육용 제품을 성공적으로 개발한 경험이 있습니다.
셋째, AI 교육 분야에서 핵심은 애니메이션 엔진이며, 저희는 VideoTutor의 핵심 개발팀입니다. 저희는 핵심 기술을 가장 잘 이해하고 애니메이션 엔진을 매우 정확하게 렌더링할 수 있는 팀입니다.
팀 자체는 마케팅 분야에서 매우 뛰어난 배경을 가지고 있으며, 커뮤니케이션을 하는 방법을 잘 알고 있습니다.
비디오튜터는 미국 주류 벤처캐피털(VC)의 공통된 의견, 즉 "젊은 천재 팀"과 완벽하게 일치합니다. 이는 젊은 인재들에게 적합한 분야를 의미하며, 뛰어난 엔지니어링 역량, 탁월한 통찰력과 경험을 갖춘 창업자, 그리고 빠른 실행력을 갖추고 있습니다. 저는 이것이 모든 투자자들이 비디오튜터에 대해 낙관적인 공통된 이유라고 생각합니다.

VideoTutor, YZi Labs EASY Residency Demo Day에서 NYSE에 데뷔
창업자 박: 귀하의 제품은 교육 산업의 핵심적인 어떤 문제를 해결하는 것을 목표로 합니까?
Kai: 현재 시중에 나와 있는 학습 제품은 능동적 학습 제품과 수동적 학습 제품, 두 가지 범주로 나눌 수 있습니다. ByteDance의 Gauth, Chegg, AnswersAi와 같은 수동적 학습 제품은 소위 "숙제 도움" 시나리오를 다룹니다. 학습 경로가 매우 짧고, 학생들은 주로 숙제 도움을 받기 위해 비용을 지불합니다.
반면, VideoTutor는 능동 학습 시나리오를 다룹니다. 학생들이 미국 SAT나 AP 시험처럼 공부하고 시험을 치러야 하기 때문에 학습 동기를 고려할 필요가 없습니다. 이 시나리오에서는 시각화와 관련된 대량 어려움이 있습니다. SAT 내용의 80%는 복잡한 이미지 렌더링이 필요한 함수나 미적분과 같은 지식과 관련이 있습니다. VideoTutor의 애니메이션 엔진은 이러한 시나리오를 매우 효과적으로 해결할 수 있습니다.

더욱이 이 분야의 평균 거래 가치는 매우 높습니다. 미국에서는 매년 평균 260만 명의 학생들이 SAT 시험을 치르며, 이는 유료 서비스에 대한 상당한 수요를 창출합니다. 대면 SAT 강좌는 시간당 요금이 부과되는 패키지 상품보다 비싸며, 시간당 평균 150달러부터 시작하며 대부분 230달러 정도입니다. 많은 학생과 학부모가 이러한 강좌에 비용을 지불합니다. 그러나 VideoTutor는 현재 AI가 생성한 비디오와 교사 교육 콘텐츠가 거의 구분되지 않기 때문에 교사 교육을 효과적으로 대체하거나 대체할 수 있습니다. 이를 통해 학생들은 최소한의 비용으로 자신에게 맞는 AI 시험 준비 튜터를 이용할 수 있습니다.
창업자 박: 이 제품을 만들기로 결심하게 된 계기는 무엇이었나요?
Kai: 사실, 저희보다 앞서 스탠퍼드 대학교의 Gatekeep AI라는 팀이 이미 이런 방식을 시도했습니다. 그들도 시각적 학습을 시도하고 있었죠. 저는 그때 이미 이 방향의 영향력을 실감하고 있었습니다. 이전 스타트업에서는 모두가 만든 교육 상품들이 ChatGPT 래퍼 제품처럼 기본적으로 GPT API에 연결되어 있었습니다. 하지만 텍스트 기반 질의응답에만 기반한 이러한 상품들은 한계가 있다는 것을 알게 되었습니다. Chegg나 Gauth 같은 회사의 업무 쇠퇴하고 있고, 많은 시나리오가 ChatGPT로 대체되고 있다는 것을 알 수 있습니다. 학생들은 ChatGPT를 사용하기 위해 20달러만 지불하면 많은 숙제 문제를 풀 수 있기 때문입니다.
API 래퍼와 최적화에 의존하는 제품은 한계에 도달했습니다.
하지만 미국 대학 입시 분야에는 다양한 시각화 학습 시나리오가 존재하기 때문에 멀티모달 시각 생성은 엄청난 잠재력을 가지고 있습니다. 안타깝게도 Gatekeep은 좋은 시작을 했지만, 너무 일찍 출시되어 지속되지 못했습니다. 기본 모델 프로그래밍 기능이 충분히 성숙되지 않았고, GPT-4도 아직 출시되지 않았기 때문입니다. 게다가 수학적 애니메이션 엔진은 렌더링과 알고리즘을 필요로 하는데, 이를 극복하지 못했습니다. 하지만 저희 팀은 애니메이션 엔진의 모든 핵심 개발 측면을 완벽하게 이해하고 이 문제를 해결하여 매우 정확한 비디오 렌더링을 달성했습니다.
PMF: 사용자는 지불 의사가 강합니다.
박창업자: 제품 출시 후 여러 학교와 협력 계약을 체결하셨습니다. 언제 또는 어떤 기능을 통해 "이 제품을 제대로 만들었고, 내가 겪고 있는 문제점을 제대로 파악했다"라고 느꼈고, PMF(제품-시장 적합성)를 달성했다고 생각하시나요?
카이: 3차원에서 논의할 수 있겠네요.
첫째, 수익 측면에서 VideoTutor는 현재까지 미국 내 유명 대형 교육 기관을 포함하여 1,000여 개 기업으로부터 API 요청을 받았으며, 국내 기관도 일부 포함되어 있습니다. 또한, 많은 학교들이 저희 서비스를 구매하고 싶어합니다. 소비자 대상(C-end) 사용자는 구매 의사가 더욱 명확합니다. 투자자이기도 한 한 학부모는 제품을 사용해 보고 친구와 가족 모두에게 추천했으며, 모두가 기꺼이 비용을 지불했습니다. 그런데 어떻게 된 일인지 제 전화번호를 알아내어 저희에게 투자하고 싶다는 문자를 보냈습니다. C-end 사용자는 지불 의사가 매우 강합니다.
둘째, 사용자 니즈 관점에서 생각해 보겠습니다. 미국에서 일대일 튜터링이 왜 그렇게 필수적인 걸까요? 부모들이 일대일 수업이 효과적이라고 믿고 그에 따른 대가를 기꺼이 치르기 때문입니다. 이제 멀티모달 AI 기술은 질문에 직접 답하는 등 사람과 같은 일대일 수업 효과를 낼 수 있습니다. 게다가 미국의 온라인 일대일 튜터들이 녹화한 비디오 수업은 AI가 생성한 비디오와 거의 구별할 수 없습니다. 이것이 바로 제가 말하는 "수요 전이"입니다. 학생들은 AI가 생성한 것과 구별할 수 없는 미리 녹화된 수업에 높은 가격을 지불하는데, 왜 AI를 사용하지 않는 걸까요? 비용은 낮추고 수업 결과는 더 좋습니다.
학생들로부터 매우 긍정적인 피드백을 많이 받았고, 많은 선생님들께서도 제품에 대해 적극적으로 홍보해 주셨습니다. 특히 초기 단계의 완료율과 사용 시간이 매우 좋았습니다. 현재 선발된 200명의 시드 사용자는 모두 초기 단계 사용자입니다.
셋째, 제품의 취향과 감각입니다. 교육 산업 전체의 발전 과정부터 비용을 지불하고자 하는 학생과 학부모의 핵심 니즈, 그리고 제품 자체의 진화까지 끊임없이 역추적해 보면, 전체 논리는 닫힌 고리와 같습니다. 따라서 이 세 가지 측면에서 PMF(제품-시장 적합성)가 충분하다고 느낄 것입니다. 가장 중요한 요소는 매우 강력한 지불 의사입니다.

FIZZ와 파트너십을 맺었습니다.
창업자 박: 많은 사용자가 적극적으로 지불 의사를 밝히고 있으며, 일부는 투자를 원해 연락하기도 합니다.
Kai: 네. SAT와 AP 과목은 지불 의사가 매우 강합니다. 이 분야의 평균 주문 금액은 100달러에서 200달러 사이이며, 오프라인 수업은 훨씬 더 비싸서 최대 800달러까지 치솟을 수 있습니다. 미국에는 SAT 시험을 치르는 학생이 260만 명이며, 그중 37%는 적극적으로 비용을 지불할 의향이 있습니다. 이 시장은 지불 의사와 수요가 매우 강한 시장입니다. 저희 상품은 이러한 수요 격차를 효과적으로 해소할 수 있습니다.
창업자 박: SAT 시험을 치르는 응시자들이 인간 튜터와 AI 중에서 선택해야 한다면 AI를 신뢰할까요?
Kai: AI는 미국 SAT나 AP 시험 수준의 문제에 거의 틀리지 않습니다. 그렇다면 오프라인 튜터보다 왜 더 좋을까요? 첫째, 비용이 저렴하고, 둘째, 학생들은 선생님의 의견이나 엉뚱한 질문을 하는 것에 대한 조급함 없이 원하는 질문을 할 수 있습니다. 언제 어디서나 24시간 학습할 수 있습니다.
더욱이 이 시장은 이전 가능합니다. 미국 시장 진출을 완료한 후에는 유료 서비스 수요가 매우 높은 캐나다와 영국 등의 A-Level 시험에도 진출할 수 있습니다.
박창업자: 유료화에 대한 현재 생각은 어떤가요?
Kai: 월 구독 옵션과 학습량당 결제 옵션이 있습니다. AI는 이미 학습 결과에 따라 결제할 수 있다고 생각합니다. 예를 들어, 799달러를 결제하면 자녀의 SAT 수학 만점을 보장해 주는 패키지를 출시할 수도 있습니다.
창업자 박: 하지만 시험 결과에 따라 비용을 지불한다면, 그것은 학생 개인의 주도성에 달려 있지 않나요?
카이: 중국 대학 입시(가오카오)는 수천 개에 달하는 방대한 주제를 다루기 때문에 불가능할 수도 있습니다. 하지만 미국 SAT는 62개 주제만 있는데, 그중 50개는 표준 문제이고 대부분의 학생들이 어려움을 느끼지 못합니다. 나머지 12개 주제도 대체로 쉽게 숙달할 수 있습니다. 학생이 논리력에 심각한 문제가 없는 한, 논리력을 배우지 못할 가능성은 거의 없습니다. 더욱이 AI의 효율성 향상 효과는 매우 큽니다.
미국의 많은 온라인 튜터링 서비스에서 이 서비스를 제공합니다. 튜터에게 1,800달러를 지불하면 SAT 시험 점수가 고정되어 있기 때문에 성공률은 거의 100%입니다. 학생의 IQ가 정상이라면 아무런 문제가 없을 것입니다. 하지만 이는 단기간에 향상될 수 없는 중국의 대학 입학 시험(가오카오)에는 적용되지 않습니다. 게다가 중국의 가오카오는 상당한 점수 차이를 요구하고 어려운 문제들이 포함되어 있는 반면, 미국의 SAT는 내용 이해도를 평가하기 때문에 절대적으로 어려운 문제가 없습니다.
성과당 지불 방식은 교사 조교들이 이미 사용해 온 모델이므로 이러한 전제 조건이 있습니다.
박창업자: 모델 비용이 가격 책정에 영향을 미치나요? 큰 점유비율 차지하나요?
Kai: 저희 분야의 평균 주문 금액은 월 69달러부터 시작해서 매우 높습니다. 현재 모델 비용이 매우 저렴하기 때문에 큰 문제는 아닙니다. 교육 산업은 모두가 가격 경쟁을 벌이는 코딩 분야와는 다릅니다. 코딩은 매우 긴 맥락을 지원해야 하기 때문입니다.
고등학생을 타겟으로 하는 제품의 경우 웹 버전이 가장 중요합니다.
박창립자: 지난번에 첫 프로토타입 개발에 두 달 정도밖에 걸리지 않았다고 말씀하셨던 게 기억납니다. 분업, 어떤 기능을 추가하고 어떤 기능을 제외할지 결정하는 등 전체 개발 주기를 어떻게 진행하실 계획이셨나요?
카이: 저희 팀 전체의 의견은 반복은 빠르게 이루어져야 한다는 것입니다. 빠르게 진행되어야만 초기 사용자로부터 빠르게 피드백을 받을 수 있기 때문입니다.
첫 번째 버전은 트위터에 공개되자마자 엄청난 반향을 일으키며 대량 사용자를 확보했습니다. 하지만 이들 중 상당수는 프로그래머, 투자자, 또는 기술 애호가였습니다. 이들을 통칭하여 "얼리 어답터"라고 부를 수 있습니다. 당시 이들의 피드백은 산발적이었고 그다지 가치 있는 것이 아니었습니다. 이처럼 광범위한 사용자층을 면밀히 분석하여 진정한 핵심 시드 사용자, 즉 우수한 고등학생을 파악하고, 협의를 통해 유용한 피드백을 수집해야 했습니다.
저희가 받은 핵심 피드백은 비디오 렌더링 정확도가 100%에 도달해야 한다는 것이었습니다. 이는 최적화에 있어 가장 중요한 부분이었습니다. UI 디자인이나 다양한 TTS(텍스트 음성 변환) 오디오-비주얼 선택 지원과 같은 기능은 제외되었습니다. 다시 제품의 핵심으로 돌아가서, 저희는 과학 관련 시나리오에 대한 지식 학습을 위해 노력하고 있으므로 그래픽 렌더링의 정확도가 무엇보다 중요합니다.
창업자 박: 당시 세대 시간은 어떻게 결정되었나요?
Kai: 당시 최대 학습 시간은 약 6분이었습니다. 일반적인 질문과 지식 포인트에 대한 설명은 6분을 넘지 않아야 한다는 것이 주요 고려 사항이었습니다. 하지만 이후 피드백을 통해 학습 능력이 약한 일부 학생들이 내용이 더 느리고 심도 있게 설명되기를 바란다는 것을 알게 되었습니다. 따라서 학습 시간은 제한되는 것이 아니라 사용자의 학습 능력에 따라 더 많이 조절되어야 한다는 것을 깨달았습니다.
창업자 박: 지금 가장 오래 머무를 수 있는 시간은 얼마나 되나요?
Kai: 한 시간 정도 걸릴 것 같고, 핵심을 파악할 때까지 계속 질문할 수 있을 거예요. 대화 중에 실시간으로 데이터가 생성되는데, 이 기능은 최근에 추가된 기능이에요. 초기 버전에는 없었거든요.
창업자 박: 처음에는 고려했지만 나중에 그다지 중요하지 않다는 것을 깨닫고 포기한 기능이 있나요?
Kai: 예를 들어 앱 같은 경우입니다. 당시에는 앱을 빨리 개발해야겠다고 생각했지만, 나중에 알게 된 건 미국 학생들이 대부분 노트북이나 아이패드를 학습에 사용한다는 것입니다. 미국의 대부분의 K-12 학교에서는 학생들에게 크롬북 컴퓨터를 제공합니다. 컴퓨터는 매우 흔하며, 학생들은 컴퓨터로 숙제를 합니다. 고등학생들은 기본적으로 컴퓨터를 한 대씩 가지고 있고, 휴대폰은 학습 상황에서 5% 미만 점유비율, 이는 매우 낮은 비율입니다.
창업자 박: 교육이나 학생을 주로 대상으로 하는 제품이라면 웹 버전을 먼저 만들고, 앱은 그렇게 중요하지 않다는 뜻인가요?
Kai: 네, 당시에도 이미 이 데이터를 알고 있었습니다. 사실 저는 미국에서 오랫동안 유학을 다녔으니까요. 나중에 초기 사용자 수만 명 중 100명을 대상으로 설문조사를 했는데, 그중 90명 이상이 컴퓨터를 가지고 있어서 더욱 확신하게 되었습니다.
창업자 박: 첫 번째 버전을 출시했을 때 K-12 연령대도 타겟으로 삼았나요?
Kai: 네, 그 후에 저희가 목표로 삼았던 것이 바로 그것입니다. 저희는 Gauth와 경쟁하는 회사는 아닙니다. 시험 준비에 더 집중하고 있죠. 미국의 대량 고등학생들이 이미 대면 튜터링이나 온라인 학습 플랫폼을 선택하고 있는데, VideoTutor는 이러한 수요를 성공적으로 충족시켜 주었습니다.
창업자 박: K12는 앞으로 1년 이상 핵심 사용자 그룹이 될 예정인가요?
카이: 이건 2년 안에 핵심 지표가 될 거예요.
대형 모델을 사용하세요. 하지만 대형 모델에만 의존하지 마세요.
박창립자: 현재 구현 중인 기술에 대해 간략하게 소개해 주시겠습니까? VideoTutor는 실제로 강좌와 차트 생성에 있어 다른 비디오 생성 모델보다 훨씬 뛰어난 성능을 보입니다. 특히 많은 모델이 텍스트를 정확하게 생성하지 못하는 상황에서, VideoTutor의 기술은 매우 놀랍습니다.
James: 저희가 제작하는 비디오에는 텍스트와 이미지가 모두 포함됩니다. 일반적인 제작 과정은 다음과 같습니다. 대규모 언어 모델이 텍스트와 해당 애니메이션 명령어를 생성하고, 애니메이션 엔진이 이 애니메이션 명령어를 렌더링하여 최종적으로 비디오에 표시합니다.
텍스트 부분은 비교적 간단합니다. 방대한 언어 모델을 사용하여 텍스트를 생성한 후 바로 렌더링합니다. 반면 애니메이션 부분은 자체 수학적 애니메이션 렌더링 엔진을 통해 생성됩니다. 이 엔진의 장점은 좌표축, 기하학적 도형 및 기타 요소를 매우 정확하게 렌더링한다는 것입니다. 바로 이것이 저희의 핵심 기술입니다.
현재의 대규모 언어 모델은 텍스트만 출력합니다. 하지만 저희 에이전트는 대규모 언어 모델에 종이와 펜을 제공하여 모델이 상상하는 교육 애니메이션을 그릴 수 있도록 하는 것과 같습니다. 그려지는 부분은 전적으로 저희 기술입니다.
창업자 박: 오디오와 비디오를 포함한 전체 영상의 최종 합성은 어떻게 처리되었나요?
James: 처음에 사용자는 "피타고라스의 정리는 무엇인가?"와 같은 질문을 제시합니다. 첫 번째 단계는 대규모 언어 모델이 질문의 난이도에 따라 일반적으로 3~5개의 시나리오를 추론하도록 하는 것입니다. 그런 다음 모델은 각 시나리오에 대한 대략적인 대본을 생성합니다. 다음으로, 각 시나리오의 대본을 기반으로 두 번째 추론을 수행하여 해당 시나리오에 대한 텍스트, 해당 이미지, 그리고 사람 음성 텍스트를 생성합니다. 이렇게 생성된 사람 음성 텍스트는 TTS(텍스트 음성 변환)를 사용하여 합성됩니다.
마지막으로, 우리는 모든 장면을 모아서 완전한 영상을 만들었습니다.
박창립자: 첫 번째 버전에서는 그게 계획이었던 것으로 알고 있습니다. 이제 상호작용 프로세스가 추가되었는데, 생성 프로세스도 변경되었나요?
James: 네, 변경 사항이 있었습니다. 사용자가 콘텐츠를 최대한 빨리 볼 수 있도록 이제 첫 번째 장면을 생성하고, 이후 장면은 백그라운드에서 렌더링합니다. 사용자가 질문하면 음성을 텍스트로 변환하고, 이 텍스트와 이전 모든 장면의 콘텐츠를 대규모 언어 모델에 전달하여 추론을 통해 다음 교육 시나리오를 계획합니다. 이후 장면의 렌더링 프로세스는 이전과 동일합니다.
박창립자: 사용자가 1분 동안 듣고 난 후 질문이 있으면 직접 질문합니다. 질문을 받은 후 이전에 다룬 내용과 함께 모델에게 다시 보냅니다. 이 과정에서 사용자가 질문을 한 후 애니메이션이 계속 재생되나요, 아니면 멈추나요?
James: 지연 시간을 초기 20~30초에서 5초 미만으로 단축했습니다. 상호작용 측면에서는 사용자가 5초에 집중하는 시간을 최소화하는 전환 효과를 구현하여 프로세스 전반의 원활한 흐름을 보장했습니다. 4~5초 안에 사용자는 자신의 질문에 맞춰 새롭게 제시된 콘텐츠를 볼 수 있습니다.
현재 설계에서는 AI 선생님이 "음, 생각해 볼게."라고 말한 후 실제 선생님처럼 칠판을 지우는 방식으로 진행됩니다. 만약 선생님이 말한 내용에 문제가 있다고 생각되면 AI 선생님이 칠판을 지우고 다시 작성해 줍니다. 이 과정이 더 자연스럽게 느껴집니다.
더욱이, 저희는 사용자의 질문을 수동적으로 기다리는 것이 아니라, 질문 진행 중에 퀴즈를 진행합니다. 퀴즈와 사용자 질문의 피드백을 활용하여 추론을 진행합니다. 또한, 마이크는 완전히 무제한이 아니므로 사용자가 직접 켜고 끌 수 있습니다.
창업자 박: 따라서 이 메커니즘을 기반으로 하면 가장 길게 생성할 수 있는 설명은 약 1시간 정도입니다.
제임스: 정확히 말하면, 한계가 없어요. 질문이 계속 생기면 계속 질문할 수 있으니까요.
Kai: 네, 미리 정해진 제한은 없습니다. 사실, VideoTutor의 접근 방식은 멀티모달 AI의 발전에 기반합니다. 저희는 수요를 창출하는 것이 아니라, 기존 수요를 더 잘 충족시키는 데 집중합니다. 오프라인 라이브 교육을 생각해 보세요. 왜 미국 부모들은 그렇게 높은 가격을 기꺼이 지불할까요? 미국 교육 및 훈련 산업은 주로 시간당 100달러부터 시작하는 일대일 수업을 제공하기 때문입니다. 오프라인 교사는 지도식 질문을 제공하고, 학생들이 이해하지 못하는 부분을 관찰한 후 추가 질문을 할 수 있기 때문입니다. VideoTutor는 이러한 실시간 교사 학습 효과를 달성하여 각 학생이 실시간으로 상호 작용하고 학습할 수 있도록 지원합니다.
창업자 박: 학생들은 수업 중에 카메라를 켜야 합니까?
Kai: 그렇지는 않습니다. 학생들이 카메라를 켜는지 여부는 주로 미국 개인정보 보호법에 따라 결정됩니다. 제품에는 카메라를 강제로 켜는 기능이 없으며, 학생의 선호도에 따라 달라집니다. 주요 상호작용은 질문과 음성 피드백을 통해 이루어질 예정입니다.
창업자 박: 기술적으로 보면, 작은 모델과 큰 클라우드 모델을 결합하는 전략을 사용하시나요?
Kai: 협업을 통해 진행됩니다. 10만 개가 넘는 비디오 샘플이 포함된 내부 데이터 세트를 보유하고 있습니다. 이 데이터 세트에서 우수한 샘플에 수동으로 주석을 달아 모델을 학습시키고 미세 조정하는 데 사용합니다. 예를 들어, 현재 8,000개가 넘는 SAT 샘플 학습 데이터를 보유하고 있습니다. 이렇게 미세 조정된 미니 모델은 클라우드에서 Claude나 Gemini와 같은 범용 상용 모델과 함께 사용됩니다.
창업자 박: 클로드, 제미니, GPT를 사용하면 제품의 핵심 성능에 영향을 미치나요?
Kai: 저희는 주로 K-12 분야를 다루고 있으며, 기본 모델 수준은 이미 충분합니다. 하지만 100% 정확도를 보장하기 위해 두 모델을 동시에 검증합니다. 두 모델의 답이 일치하면 기본적으로 오류가 발생하지 않습니다. 코드 생성에는 코딩 기능이 매우 뛰어난 Claude를 주로 사용합니다.
박창업자: 현재 제품의 기술적 병목 현상은 무엇인가요? 모델링 기능인가요, 아니면 코드 생성인가요?
Kai: 모델 성능은 하나의 측면입니다. 또 다른 측면은 렌더링입니다. 저희는 이미 5초 이내로 렌더링을 완료했으며, 더 많은 GPU를 활용하면 더욱 빨라질 수 있습니다. 또 다른 측면은 장기 기억 능력입니다. 학생들이 어떤 지식을 이해하지 못하는지 파악하기 위해 학생들의 장기 학습 행동 데이터를 축적해야 합니다. 예를 들어, 한 달 전에 배운 내용을 잊어버렸다면 다시 상기시켜 줄 수 있습니다.
James: 저희는 렌더링 시간 개선에 많은 노력을 기울여 왔으며, 끊임없이 기술 혁신을 이루어 왔습니다. 처음에는 2분 걸리던 렌더링 시간이 1분으로, 현재는 10초 미만으로 단축되었습니다. 궁극적인 목표는 렌더링 지연 시간이 거의 없이 렌더링을 구현하여 사용자가 질문하면 추론이 완료된 후 즉시 결과를 확인할 수 있도록 하는 것입니다. 이는 저희 팀이 현재 해결하고 있는 과제이지만, 새로운 방향을 찾았습니다.
완료율을 무시하고 최종 시험 점수에만 집중
박창업자: 이 단계에서 제품의 핵심 지표는 어떻게 측정하시나요? 동영상이 사용자에게 유용한지 어떻게 판단하시나요?
Kai: 가장 중요한 지표는 시험입니다. 새 버전에서는 영상을 시청한 후 마지막에 퀴즈가 있습니다. 정답을 맞히면 내용을 이해했다는 것을 증명하고, 틀렸다면 설명이 명확하지 않았다는 것을 증명합니다.
학습 효과는 완료율만으로 판단할 수 없습니다. 일부 학생들은 중간쯤에 내용을 이해할 수도 있습니다. 만약 중간에 시험을 치러 통과하면 나머지는 다시 볼 필요가 없습니다. 저희 제품의 핵심 지표는 얼마나 많은 학생이 점수를 향상시켰는가입니다.
박창업자: 하지만 그의 기말고사는 다른 곳에서 치러졌는데, 합격 여부는 어떻게 알았나요?
Kai: 미국의 제품 문화에 대해 이야기해 보겠습니다. 사용자들이 제품 사용 후 긍정적인 경험과 결과를 자발적으로 공유하는 문화죠. VideoTutor를 사용하고 SAT 시험을 치른 많은 학생들이 자신의 경험과 점수를 적극적으로 공유합니다. 또한, 저희는 이들을 캠퍼스 홍보대사로 임명하여 더 널리 알리고 있습니다.
저희는 고등학생 20명을 캠퍼스 홍보대사로 활동시키고 있습니다. 사실, Mercor는 초창기에는 전형적인 "사용자 성공 사례" 모델을 활용하여 매우 성공적이었습니다. Mercor는 많은 인도 프로그래머들이 미국에서 일자리를 찾을 수 있도록 도왔고, 그들은 이 사용자들에게 연락하여 사용자 사례를 만들고 Mercor를 통해 어떻게 일자리를 찾았는지 설명했습니다. 이를 통해 훌륭한 입소문 마케팅 효과를 얻었습니다. VideoTutor도 같은 원칙을 따릅니다. 저희는 더 많은 학생들이 제품을 사용하여 훌륭한 성과를 거두기를 바라며, 이러한 학생들의 사용자 사례를 만들어 공유합니다.
창업자 박: 학생들은 주로 어디에서 자신의 경험을 공유하나요?
카이: 학생들은 주로 틱톡을 사용하고, 부모님들은 페이스북 그룹을 사용합니다.
창업자 박: 6개월이나 1년의 기간을 두고 제품 성장을 위한 계획은 무엇인가요?
Kai: 기본적으로 VideoTutor는 여전히 소비자 중심(C-end) 제품이기 때문에 입소문 마케팅이 매우 중요하다고 생각합니다. 많은 성공적인 AI 애플리케이션은 얼리어답터들의 입소문에 의존했습니다. 예를 들어, 개발자들이 VideoTutor를 사용하고 좋아하면서 확산되었습니다. 저희에게 핵심 지표는 얼마나 많은 SAT 응시자들이 VideoTutor를 사용하여 고득점을 받았는지, 그리고 이를 다른 아이들과 학부모들에게 전파했는지입니다. 학부모들은 주로 페이스북과 인스타그램을 사용하고, 학생들은 틱톡을 사용하는데, 저희는 이러한 플랫폼을 통해 VideoTutor를 전파합니다. 이러한 공감대 기반의 입소문이 형성되면 학교 교사들도 자연스럽게 VideoTutor를 알게 될 것입니다. 많은 학교들이 VideoTutor를 일찍부터 알게 된 이유는 많은 교사들이 VideoTutor를 사용하고 좋아했으며, 학교 구매 관리자에게 추천했기 때문입니다. 따라서 가장 중요한 요소는 여전히 C-end 사용자들의 입소문 마케팅입니다. 핵심 지표는 VideoTutor를 사용한 후 얼마나 많은 학생들의 점수가 향상되었는지입니다.
박창립자: 새로운 버전의 전반적인 상태와 출시 일정은 어떻게 되나요?
Kai: 빠르면 두 달 안에 공개할 예정입니다. 그때쯤이면 학생들은 매우 짧은 지연 시간으로 질문에 대한 답을 얻을 수 있을 것이고, 과학 시나리오의 그래픽 렌더링은 100% 정확할 것입니다. 물론, 당분간은 경쟁 시나리오나 선형 대수와 같은 복잡한 대학 지식은 다루지 않을 것입니다. K-12 분야에 더 집중할 것입니다.
창업자 박: VideoTutor의 현재 장벽이나 난관은 무엇입니까?
Kai: 몇 가지 중요한 점이 있다고 생각합니다. 첫째는 데이터 플라이휠입니다. 모든 비디오 뒤에는 코드가 있습니다. 사용자가 2차 주석을 추가한 후 생성한 좋은 비디오 데이터는 모델을 재학습하고 미세 조정하는 데 사용할 수 있습니다. 데이터가 많을수록 비디오 품질이 향상됩니다. 또 다른 핵심은 학습 행동 데이터입니다. 학생들이 어떤 지식 영역에서 취약한지 파악하여 데이터 플라이휠을 구축할 수 있습니다. 더 많은 사람들이 사용할수록 제품이 학생들을 더 잘 이해하게 됩니다. 둘째는 애니메이션 엔진 알고리즘과 같은 선도적인 기술적 이점입니다. 알고리즘 자체가 가장 핵심적인 이점은 아니지만, 빠르게 반복하고 더 많은 데이터를 수집할수록 이점이 더욱 분명해질 것입니다.
셋째, 브랜드입니다. VideoTutor는 이미 북미 학부모들 사이에서 AI 교육 분야를 선도하는 브랜드로 자리매김했으며, 학부모들의 신뢰 또한 눈에 보이지 않는 장벽입니다.
창업자 박: VideoTutor가 3~5년 안에 어떤 제품이 될 것으로 예상하시나요?
Kai: 앞으로 VideoTutor가 STEM 과목을 배우는 모든 사람을 위한 AI 교사가 되기를 바랍니다. 저희는 STEM 분야에만 집중하고 있습니다. 앞으로 Duolingo를 능가할 것이라고 생각합니다. Duolingo는 세계적인 수준의 언어 학습 제품이지만, STEM 분야에서는 과거에는 세계적인 수준의 제품이 없었습니다. STEM은 많은 그래픽 렌더링을 필요로 하기 때문입니다. 이제 기본 모델 기술이 준비되었으니, STEM 분야에서 차세대 "Duolingo"가 등장할 것이라고 생각합니다.
우리는 특히 국내 대기업 출신의 인재를 모집하고 있습니다.
박창업자: 이전에도 여러 차례 창업 경험을 하셨는데요, 어떤 경험이셨나요?
카이: 저는 지금 대학교 3학년입니다. 1학년 때 제임스와 함께 교육 제품 스타트업을 시작하여 20만 달러의 엔젤 투자를 유치했습니다. 실패했지만, 값진 교훈을 얻었습니다. 동질적인 경쟁에 갇히면 안 된다는 것입니다. 당시 저희 앱은 시장에 유사한 제품이 너무 많아서 초기 단계의 사용자 확보 경쟁에 시달려 수익 창출이 어려웠습니다.
두 번째 스타트업에서는 MathGPTPro에 공동 창업자로 합류하여 몇 달 동안 함께했습니다. 그 기간 동안 제품 지표 분석, 제품 개발, 그리고 사용자 기반 확장 방법을 익혔습니다. 텍스트 기반의 답변 중심 교육 제품이 한계에 도달했다는 결론도 이때 나왔습니다. ChatGPT와 크게 다르지 않았고, 좌예방(Zuoyebang)과 같은 기업들이 막대한 투자를 했던 구조화된 지식 문제 은행이 대규모 모델 편집 기능으로 대체되고 있었기 때문입니다. 따라서 세 번째 스타트업에서는 시각화가 필연적인 트렌드임을 깨달았습니다.

하버드 대학교에서 샘 알트먼과 함께 찍은 조카이의 사진.
창업자 박: 텍스트 기반 제품의 한계를 깨닫게 된 것 외에도, 과거의 두 가지 경험이 현재 VideoTutor에서 하는 업무에 팀워크나 다른 측면에서 어떻게 도움이 되었나요?
카이: 정말 도움이 돼요.
첫째, 제품의 방향과 미래 잠재력을 더 잘 파악하는 데 도움이 됩니다. 경쟁사 웹사이트 트래픽과 매출을 분석하여 제품의 전반적인 발전 상황을 평가합니다.
둘째, 제품 개발 측면에서는 제품 설계, 프런트엔드와 백엔드 통합을 포함한 제품 개발 속도를 보다 잘 판단할 수 있으며, 어떤 지표를 살펴봐야 할지도 파악할 수 있습니다.
셋째, 팀 관리 및 조직 문화 역량입니다. 업무 분담, 보상, 팀원별 스톡옵션 발행 등 더욱 포괄적인 관리 시스템을 구축했습니다. 또한, 융자 조달 방법을 익혔습니다. 이번 라운드에서는 1,000만 달러 규모의 융자 20일 만에 완료했습니다.
창업자 박: 지금 당신의 팀에는 몇 명이 있나요?
카이: 6명이 같이 살고 있어요.
창업자 박: 팀은 처음에 어떻게 구성되었나요?
Kai: James와 저는 이미 두 개의 사업을 시작했습니다. 같은 대학교를 졸업했고, 1학년 때 함께 앱을 만들었습니다. 2학년 때 다른 두 사람과 함께 사업을 시작했는데, 저희는 모두 서로 아는 사이였습니다. 이 기술이 매우 큰 제품 비전을 가져올 수 있다는 것을 깨달았을 때, 서로 연락하여 이 제품을 개발할 팀을 구성했습니다. 팀의 또 다른 파트너이자 제 대학 룸메이트였던 Nick을 포함하여 모두 동문이었습니다.
박창업자: 지금 채용 규모를 확대할 계획이신데, 어떤 인재를 채용하고 싶으신가요?
Kai: 저희는 백엔드, 프런트엔드, 대규모 언어 모델, UI/UX 분야를 주로 채용하고 있으며, 경력자를 선호합니다. 시행착오적인 단계를 넘어 빠르게 제품을 개발하는 단계로 접어들면서, 저희의 성장을 위해 경력자의 도움이 절실히 필요하기 때문입니다.
창업자 박: 제품을 1에서 10으로, 심지어 10에서 100으로 성장시키려면 경험이 풍부한 엔지니어, 제품 관리자, 성장 리더가 필요합니다.
카이: 네, 그 단계입니다. 엔지니어 채용을 최우선으로 하여 팀을 9~10명까지 확대할 예정입니다.
이번 채용은 국내에서 진행될 가능성이 높으므로, 대면 채용과 원격 채용을 혼합한 방식이 될 것입니다.
창업자 박: 이 사람이 어떤 인물로 그려지기를 바라시나요?
Kai: 저희는 ByteDance나 Meituan 같은 대기업에서 근무한 경험이 있는 분을 선호합니다. ByteDance는 젊은 인재를 중시하는 빠르고 역동적인 조직 문화를 가지고 있습니다. ByteDance에서 교육받은 인재들은 탄탄한 방법론과 역량을 갖추고 있으며, 저희와 함께하면 성공적인 경험을 공유하고 학습에 활용할 수 있습니다.
국내 유수 기업들의 고압적이고 빠른 반복 전략에 경험이 있는 분들을 찾고 있습니다. 학생 창업 단계는 지났고, 더 이상 완전 초보자를 채용할 필요가 없습니다. 경력이 좀 더 필요하지만, 업계 베테랑은 아닙니다. 업계 베테랑은 가정을 책임져야 할 수도 있고, 그만큼 추진력이 부족할 수 있습니다. 따라서 젊고 추진력 있는 중간 단계의 인재가 이상적입니다.
최고의 인재들에게 후한 스톡옵션을 제공할 의향이 있습니다. 1,100만 달러를 유치했는데, 왜 미국 엔지니어를 채용하지 않았을까요? 중국의 제품 개발 및 엔지니어링 역량이 정말 뛰어나다고 생각하기 때문입니다. 이번 기회를 통해 중국 출신 팀이 국제적으로 성공할 훌륭한 제품을 만들어낼 것이 거의 확실합니다. 현재 많은 AI 애플리케이션이 중국인들에 의해 개발되고 있으며, 중국의 엔지니어링 역량은 정말 놀랍습니다. 이것이 우리의 강점이기도 합니다. 중국과 미국의 강점을 모두 활용해야 합니다.
실리콘 밸리의 대학생들은 모두 AI 사업을 시작하고 있습니다.
박창립자: 대학생 창업가 정신의 추세는 특히 실리콘 밸리에서 두드러지고 있습니다. 어떤 상황이라고 생각하십니까?
Kai: 사실 하나를 살펴보죠. 이번 투자 라운드에서 가치 평가를 받은 기업들을 예로 들어보겠습니다. AI 기반 채용에 주력하는 Mercor는 이미 3억 달러 이상의 신규 융자 완료하여 기업 가치를 100억 달러 이상으로 끌어올렸습니다. Cursor는 이미 100억 달러의 기업 가치를 인정받아 이미 투자가 확정된 상태입니다. GPTZero나 Pika 같은 기업들도 있습니다. 이들은 모두 대학생 스타트업이며, 특히 Cursor와 Mercor의 창업자는 모두 대학교 3학년 때 중퇴했습니다.
이 젊은 기업가들의 물결은 공통적인 특징을 공유합니다. 바로 고도로 차별화된 경쟁입니다. 이들은 매우 좁은 분야에 집중하며, 일반적인 접근 방식은 지양합니다. 예를 들어, AI 채용에 주력하는 Mercor는 처음에는 인도 프로그래머만 채용했습니다.
두 번째는 환경입니다. 스탠퍼드, Y 컴비네이터, 피터 틸 펀드 등 실리콘 밸리의 자본 환경과 기반 혁신은 대학생 창업 초기 단계부터 지원합니다. 이들은 아이디어의 성숙도 여부와 관계없이 기꺼이 지원하며, 탄탄한 인맥을 제공합니다.
셋째, 저는 이 대학생들의 자질이라고 생각합니다. 저희든 실리콘 밸리의 대학생이든, 그들은 모두 매우 용감한 모험심과 뛰어난 학습 능력을 가지고 있습니다. 이러한 모험심은 중국의 많은 학생들에게 부족할 수 있습니다. 실리콘 밸리에는 여러분 주변에 성공한 동료들의 훌륭한 사례들이 많고, 투자 환경 또한 젊은이들을 더 기꺼이 믿어주는 분위기이기 때문입니다.
저는 당시 비용과 편익을 따져보았습니다. 대학을 졸업하고 취직을 하기로 했다면, 유학 비용을 가족에게 갚을 수 없을지도 모르고, 큰 수익도 기대할 수 없었을 겁니다. 하지만 사업을 시작하기로 했다면, 어린 시절부터 열정적으로 배울 수 있었고, 제 삶에는 무한한 가능성이 펼쳐질 것입니다. 저는 어렸을 때부터 훌륭한 회사를 만들고 싶었습니다.
박창업자: 왜 오늘날 대학생 세대는 수백억 달러 가치의 기업을 만들 수 있을까요? 과거에는 천만 달러에서 2천만 달러에 팔리는 것만으로도 큰 업적으로 여겨졌을까요? AI 붐이나 버블 요인이 작용했을까요?
카이: 완전히 거품이라고는 생각하지 않습니다. 커서는 4억 5천만 달러의 실질 매출을 기록하고 있는데, 이는 매우 안정적인 수치입니다. 이러한 성장의 배경에는 이 젊은 세대 팀들의 핵심적인 방법론과 통찰력이 있습니다. 이 팀들을 보세요. 모두 훌륭한 배경을 가지고 있고, 학습 능력도 매우 뛰어납니다.
커서는 처음에는 AI에 매우 적극적이고 강력한 피드백을 제공한 대학생 프로그래머 팀에 의지했습니다. 창립자 자신도 사용자에 대한 깊은 이해와 뛰어난 엔지니어링 반복 능력을 갖춘 재능 있는 엔지니어였습니다. 이 제품은 초기에 단 네 명의 인원으로 처음부터 개발되었습니다. 제품을 성공적으로 반복한 후, 사용자들 사이에서 명성을 쌓고 수익을 창출했으며, 제2의 마크 저커버그를 놓칠까 봐 우려했던 투자자들은 투자를 유치했습니다.
가장 근본적인 조건은 이 AI 물결에 등장하는 많은 기술들이 새롭고, 젊은 세대가 빠르게 배우고, 실용적이며, 신뢰성 있고, 대담하다는 것입니다. 따라서 이들은 사용자에 대한 깊은 이해와 기존 제품을 능가하는 초고속 반복 속도를 갖추고 있습니다. 예를 들어, Cursor 이전에는 GitHub Copilot도 꽤 훌륭했지만, 왜 Cursor를 이기지 못했을까요? 바로 사용자 경험과 실행 속도 때문입니다.
창업자 박: AI가 새로운 기술이기 때문에 많은 제품에 대한 인식도 새로운 관점에서 볼 필요가 있다고 할 수 있을까요?
Kai: 네, 젊은 세대 기업가들은 이전 세대보다 더 깊은 이해와 통찰력을 가지고 있으며, 사용자와 더 가깝습니다. 현재 주류 AI 사용자는 모두 2000년 이후에 태어났으며, 학습 및 피드백 반복 속도와 관용도가 이전 세대 기업가들보다 더 빠릅니다.
따라서 인지적 반복의 속도가 핵심입니다. 모바일 인터넷 시대에는 기술 반복이 연도나 분기 단위로 측정되었지만, AI 시대에는 며칠 단위로 측정될 수 있습니다. 창업자는 빠르게 학습해야 하며, 젊은 세대는 밤늦게까지 깨어 있고 추진력이 더 강할 가능성이 높습니다.
파운더 박: 일부 언론에서 실리콘 밸리의 많은 창업자들이 996(오전 9시부터 오후 9시까지, 주 6일) 근무를 시작했다고 보도했습니다. 이에 대해 어떻게 생각하시나요?
Kai: 제 백인 사업가 친구들 중 몇몇은 많은 돈을 모았고, 그들도 996(오전 9시부터 오후 9시까지, 주 6일)에서 일합니다. 저희처럼 큰 집을 빌려서 모두가 함께 살고 일합니다. 996은 환경 때문에 어쩔 수 없이 선택한 것 같아요. 실리콘 밸리는 지금 골드러시와 비슷해요. 아무도 뒤처지고 싶어 하지 않으니까요. 유일한 경쟁 상대는 제품 반복 속도인데, 빠르게 반복하려면 밤늦게까지 일해야 하거든요. 모든 것을 형성하는 환경이 사람들을 이렇게 만들도록 강요하는 거죠.
박창업자: 실리콘 밸리의 대학생 창업가들이 선택하는 사업 분야는 어떤 추세인가요?
Kai: 교육 분야든 다른 분야든, 익숙한 영역에서 사업을 시작하는 경향이 있다고 생각합니다. 익숙한 영역이란 해당 분야와 사용자에 대한 이해 수준을 의미합니다. Cursor의 창립자는 코딩에 대한 깊은 이해를 가지고 있었고, 저희는 교육 분야에서 사업을 시작한 이유는 타겟 고객을 잘 이해하기 때문입니다. 요즘 젊은이들은 낯선 분야에 성급하게 뛰어들기보다는 익숙한 영역에서 사업을 시작할 가능성이 더 높습니다. 사용자 피드백을 더 빠르고 정확하게 받을 수 있기 때문입니다.
지식의 계층화도 있습니다. 교육 분야에서 세 번 일하면서 제 이해는 끊임없이 발전해 왔습니다. 이 대학생들은 이전에 해본 적 없는 일을 성급하게 시도할 가능성이 적습니다. 그들은 항상 그 일을 더 잘할 방법을 고민합니다. 그들은 새로운 세대의 사고방식을 가지고 있으며, 자신만의 인지적 틀 안에서 끊임없이 반복하고 기회를 창출하는 데 과감합니다.
또 다른 핵심 요소는 위험을 감수하는 과감한 정신입니다. 그들은 다른 사람들의 의견에 쉽게 흔들리지 않고 "당신이 나에 대해 어떻게 생각하든 상관없어"라는 태도를 보이며 강한 자신감을 드러냅니다. 이러한 태도 뒤에는 "고속 실험" 문화가 있습니다. 제품이 아직 준비되지 않았다는 것을 알지만, 개의치 않습니다. 빠르게 출시하고, 빠르게 반복하며, 빠르게 피드백을 받습니다.
창업자 박: 이런 추세는 언제부터 시작되었나요?
Kai: 저는 이것이 합의에 기반한 성공이라고 생각합니다. GPTZero와 같은 프로젝트가 기숙사 방에서 시작해 끊임없이 반복하며 자본 지원과 사용자 인지도를 얻는 모습을 보면, 빠른 시행착오와 빠른 성장을 통해 합의를 이끌어낸 성공 사례가 훨씬 더 많아진다는 것을 알 수 있습니다.
간단히 말해, "완벽보다 더 잘하는 것"입니다. 완벽보다 완성이 더 중요합니다. 경쟁에 대한 걱정도 크지 않습니다. 많은 실리콘 밸리 창업자들은 빠르게 반복한다면 모방을 두려워하지 않고 자신의 제품 아이디어를 기꺼이 공유합니다. 저는 이 젊은 세대가 뛰어난 스토리텔링 능력을 가지고 있다고 생각합니다. 이 스토리텔링은 공허한 수사가 아니라, 실용주의와 진실에 기반을 두고 미래에 대한 비전을 제시합니다.
창업자 박: 먼저, 자신을 홍보하세요.
카이: 네. 근본적인 사고방식은 모험심과 극도의 자신감에 있다고 생각합니다. 이러한 자신감을 바탕으로, 그들은 끊임없이 용감하게 시도하고 실패하며, 잘못된 말을 하는 것을 두려워하지 않습니다. 그들은 제품 아이디어를 과감하게 표현하고, 과감하게 실행하며, 실수하더라도 간단히 바로잡을 수 있습니다. 시도하고 실패하는 것을 두려워하지 않는 이러한 문화가 대학생들 사이에서 기업가적 열정과 성공의 물결을 일으키는 데 기여했습니다.
미국의 VC도 대학생의 프로젝트에 관심을 갖고 있으며, Y Combinator는 매 라운드마다 일부 대학생 프로젝트에 정기적으로 투자합니다.
VideoTutor가 지금 가장 걱정해야 할 일은 융자 입니다.
Founder Park: VideoTutor를 처음 시작했을 때로 돌아갈 수 있다면, 스스로에게 어떤 조언을 해주고 싶으신가요? 무엇을 더 잘할 수 있었을까요?
Kai: 속도가 더 빨라져야 한다고 생각합니다. 그리고 팀 구성도 중요하죠. VideoTutor 팀은 여러 단계의 개선 과정을 거쳤습니다. 진작 알았더라면 제품에 필요한 기술 프로필을 기반으로 팀을 구성하는 게 더 좋았을 텐데요. 결국 스타트업에는 조직력이 중요하다고 생각합니다. 인재를 선발하고, 발굴하고, 효과적으로 활용하는 조직력에 더 많은 시간을 투자할 것입니다.
현재 팀은 0명에서 1명으로 성장하기에 적합하지만, VideoTutor를 더 크게 만들려면 더 많은 경험이 풍부한 인재가 필요하며, 그들의 뛰어난 경험과 능력을 팀에 가져와 전체 팀이 함께 성장할 수 있도록 도와야 합니다.
창업자 박: VideoTutor가 앞으로 6개월 동안 어떤 종류의 제품 또는 기술적 과제에 직면할 것으로 생각하시나요?
Kai: 렌더링이 첫 번째 측면이라고 생각합니다. 진정한 제로 레이턴시를 달성하려면 엔지니어링 측면에서 획기적인 발전이 필요합니다. 두 번째 측면은 성장인데, 이는 제품 취향과 관련이 있다고 생각합니다. 여기에는 UI와 인터랙션 디자인이 매끄럽고 완벽한지, 기능적 인터랙션에 버그가 없는지, 시각적 레이아웃이 아름다운지 등 여러 요소가 포함됩니다. 이 모든 것이 저희에게는 어려운 과제입니다.
James: 처음에는 VideoTutor를 모든 과목을 위한 시각적 교육 및 튜터링 플랫폼으로 포지셔닝했던 것 같습니다. 하지만 나중에는 수학 분야에만 집중하게 되었는데, 저희가 가장 잘하는 분야이기 때문입니다. 저희의 수학적 렌더링 엔진은 가장 전문적입니다. 다음 주요 혁신은 수평적 확장이 될 가능성이 높습니다. 예를 들어, 시각화의 장점을 인문학 분야에 어떻게 적용할 수 있을까요? "정오에 밭을 갈면 땀방울이 땅에 떨어진다"라고 설명하는 것처럼요. 이는 앞으로 기술적으로 고려해야 할 부분입니다.
창업자 박: 창업자의 배경이 이후 사업 확장에 문제를 일으킬 수 있을까요?
Kai: 그렇지는 않아요. 사실 a16z처럼 많은 대형 VC들이 저희에게 접근해 왔어요. 너무 일찍 투자하지는 않고, 팀이 이미 성공 조짐을 보일 때만 투자를 도와주기 때문에 투자가 실패하지 않을 거라는 확신을 가질 수 있죠. 저희는 많은 대형 VC들과 매우 좋은 관계를 유지하고 있습니다.
VideoTutor가 가장 걱정하는 부분은 융자 입니다. 가장 큰 관심사는 사용자 생태계와 제품 자체입니다.




