Rabbit의 R1은 또 다른 AI 기반 기믹입니다.

avatar
WIRED
05-04
이 기사는 기계로 번역되었습니다
원문 표시

“아아아, 이거 너무 답답해!”

그 말은 내가 운전하는 동안 Rabbit R1 에게 "가장 가까운 커피숍이 어디죠?"라는 간단한 질문을 하려던 내 동생이 한 말입니다. 스마트폰이면 너무나 쉽게 대답할 수 있는 질문이지만, 인공지능의 위력을 다 갖춘 R1은 우리를 침묵하게 만들었다. 생각하고 있다는 신호를 우리에게 주고 싶지도 않았고 그저 침묵만 지켰을 뿐입니다.

그 시원한 봄날 저녁, 우리가 몇 가지 다른 질문을 했을 때, R1이 응답하는 데 너무 오랜 시간이 걸려서 R1이 답변을 내뱉 자마자 내 동생이 다시 질문을 하기로 결정했습니다. 우리는 처음부터 다시 시작해야 했습니다. 그것은 재미있고 짜증나며, 급성장하는 기술과 이런 종류의 혼동이 흔했던 Alexa와 Google Assistant의 초창기를 연상시켰습니다. 이 특정 인스턴스는 그때까지 대부분의 R1 상호 작용이 훨씬 더 합리적인 응답 시간을 가진 오디오 신호를 가지고 있었기 때문에 버그인 것처럼 보였습니다.

버그가 있든 없든, 이 앱을 사용하는 동안 경험은 대체로 동일했습니다. 나는 지난 주에 그것을 테스트하면서 Rabbit R1이 상당히 쓸모없다는 것을 알았습니다. 내 질문에 대한 응답을 뱉어내는 순간이 있는데, 그 정확성(또는 아마도 도움이 되는 답변을 제공했다는 사실)에 놀라서 고개를 끄덕이게 됩니다. 하지만 R1에 대한 가장 큰 문제는 용도를 찾는 것입니다. 이제 나는 어디를 가든 두 번째 장치를 가지고 다녀야 할 뿐만 아니라 R1이 완료할 수 없는 작업을 완료하기 위해 전화기를 꺼내는 경우가 더 많습니다. 이 빨간색-주황색 장치는 개인 비서가 아니라 무게입니다.

Rabbit은 CES 2024 에서 R1을 발표했습니다. CES에서 AI 기기 출시? 줄을 서다. 그러나 Rabbit의 창립자 Jesse Lyu는 어느 정도 입지를 굳혔습니다. 그는 자신의 첫 스타트업인 Raven Tech(Flow라는 모바일 운영 체제를 구축하고 있던 Y Combinator의 지원을 받은 회사)를 2017년에 중국 기술 대기업 Baidu에 매각했으며 나중에 하드웨어 총괄 관리자로 합류했습니다. 당시에는 " 알렉사에 대한 중국의 대답 "으로 묘사되었습니다. 그러나 이 기술은 결코 성공하지 못한 것 같습니다 .

CES에서 Lyu는 R1의 시연을 하지 않았지만 회사는 R1이 부활절 무렵에 배송될 것이라고 말했습니다. 흥미로운 발표였습니다. 이 귀엽고 복고풍의 주황색-빨간색 장치는 스웨덴의 유명한 디자인 회사인 Teen Engineering이 디자인했습니다. Carl Pei의 Nothing의 제품 디자인을 도왔던 바로 그 회사입니다. (TE의 창립자는 현재 Rabbit의 최고 디자인 책임자입니다 .)

그 모습을 부정할 수가 없습니다. 비트(Bit) 플라스틱 같긴 하지만 색상이 눈길을 사로잡네요. 왼쪽에 정렬된 작은 수직 2.88인치 터치스크린이 있지만 터치를 사용하여 상호 작용할 수는 없습니다(Wi-Fi 비밀번호 입력과 같은 작업을 위해 키보드를 사용해야 하는 경우에만). 대신 오른쪽에는 큰 스크롤 휠이 있고 가장자리에는 버튼이 있습니다. 구석에 카메라가 있고 앞뒤로 회전할 수 있습니다(사생활 보호를 위해 사용하지 않을 때는 옆으로 회전할 수도 있습니다). USB-C를 통해 충전됩니다.

하나를 구입한 후에는 데이터 요금제를 제공하기 위해 추가 비용을 지불해야 한다는 점을 명심하세요. SIM 카드를 추가할 수 있는 SIM 슬롯이 있고 R1은 4G LTE만 지원합니다. 그렇지 않으면 Wi-Fi에 연결할 수 있습니다(또는 스마트폰에서 테더(Tether) 할 수도 있습니다). Bluetooth도 지원되므로 무선 이어버드를 페어링할 수 있습니다.

약속은 간단했다. 장치에 대고 말하면 Rabbit의 "Large Action Models" 덕분에 작업이 완료됩니다. Uber에 전화하고, OpenTable을 통해 저녁 식사 계획을 예약하고, Spotify를 통해 노래를 재생하고, DoorDash에서 음식을 주문하세요. 말하기만 하면 처리됩니다. 그것은 마치 당신이 개인 비서에게 스마트폰을 건네주고 당신을 위해 뭔가를 해달라고 요청하는 것과 같습니다.

당연히 가젯의 핵심 기능은 대규모 언어 모델에 대한 PTT(Push-to-Talk) 액세스이기도 합니다. 무엇이든 물어보고 Google에 무언가를 입력한 것처럼 답변을 얻을 수 있습니다(주로 Perplexity의 AI 모델을 사용함 ). 카메라도 있으므로 피사체를 가리키고 시각적 질문에 대한 답변을 얻을 수 있습니다. 기술 언론에서 여러 Best of CES 목록을 만들었습니다( 우리는 아니지만 ).

R1의 현실은 많은 일을 약속하지만 실제로는 거의 하지 않는다는 것입니다. 먼저 설정 프로세스에 대해 언급해야 합니다. 이는 제가 거의 10년 동안 개인 장치를 테스트하면서 수행한 가장 개략적인 작업 중 하나입니다. R1과의 모든 정보 및 타사 통합에 액세스할 수 있는 유일한 방법인 맞춤형 웹 포털인 Rabbithole에 연결하고 장치를 설정합니다.

홈페이지는 Humane AI Pin의 웹 포털 과 매우 유사하게 R1에 요청한 모든 항목을 볼 수 있는 곳입니다. 단, R1에는 내가 요청한 항목을 기록하지 않은 큰 데이터 공백이 있습니다. 그런 다음 연결 탭이 있습니다. Uber, DoorDash, Midjourney 및 Spotify를 포함하여 현재 지원되는 서비스에 대한 계정을 연결하는 곳입니다.

이러한 서비스 중 하나를 연결하기 위해 Rabbit은 IT 팀이 컴퓨터에 원격으로 액세스할 수 있도록 설치하도록 요청하는 소프트웨어 유형인 가상 네트워크 컴퓨팅 시스템을 사용합니다. 이는 URL에 표시되며 전체 경험이 느리다 는 사실입니다. 귀하는 귀하의 로그인 정보를 사용하여 서비스에 로그인하게 되며, 어느 정도 Rabbit에게 귀하의 인증 자격 증명( 개인 정보 보호 정책 에 명시된 대로)을 전달하게 됩니다. 회사에서는 이러한 제3자 서비스에 대한 사용자 자격 증명을 저장하지 않는다고 말하지만, 그렇다고 해서 불편함을 덜 느끼는 것은 아닙니다.

이 앱은 Rabbit과 공식적인 관계가 없습니다. 당신은 Uber의 인터페이스 사용법을 배우는 데 수백 시간을 소비한 작은 봇을 사용하고 있으며 Rabbit은 작은 화면에 세부 정보를 표시하기 위해 장치에 대한 사용자 정의 인터페이스를 만들어야 합니다. 이러한 복잡한 상호 작용 계획은 Uber가 더 이상 고객이 사용자 인터페이스를 인식하는 방식을 제어할 수 없음을 의미하므로 Uber와 같은 회사가 이러한 "토끼"를 블록 하려고 시도할지 궁금합니다. 이제 Rabbit은 사용자가 이러한 제3자 서비스를 사용하여 수행하는 작업(Google 및 Android 모바일 운영 체제에서 수행하는 작업과 유사)에 대한 모든 데이터를 수집할 수 있는 계층 역할을 한다는 점을 기억하세요.

또한 Rabbit의 접근 방식, 이로 인해 발생하는 개인정보 보호 문제 , 그리고 Lyu를 " 사기꾼 "으로 묘사하는 것에 대해 소셜 공간에서 많은 반발이 있었습니다. 소위 LAM은 실제로 인공 지능을 사용합니까? Rabbit의 시스템은 Android를 실행 하지만 회사는 모든 AI 컴퓨팅이 클라우드에서 발생한다고 주장합니다. 그렇다면 왜 이것이 앱이 될 수 없습니까 ?

어느 쪽이든 클라우드 기반 상호 작용은 버벅거립니다. Uber가 작동하지 않았습니다. "Uber 서비스에 문제가 발생했습니다"라는 메시지가 화면에 자주 표시됩니다. 저는 Spotify나 Midjourney(유료 계정 필요)를 사용하지 않으며 Rabbit은 새 계정을 만드는 것을 권장하지 않습니다. "최고의 경험과 우리 서비스와의 호환성을 보장하려면 연결된 계정이 새로운 것이어서는 안됩니다. "라고 회사는 지침에 말합니다. "상당한 기간 동안 활성화된 계정을 사용하는 것이 좋습니다."

그러면 DoorDash가 남고… 음. 아래 내 트윗에서 이 내용을 확인할 수 있습니다. 나는 부리또를 주문해 달라고 요청했고, 내가 사는 지역에 3~4곳의 레스토랑이 배달되었습니다. 하나를 선택했는데 놀랍게도 R1의 화면에서는 메뉴 항목이 총 6개밖에 보이지 않았습니다. 그 중 2개는 부리또(내가 원한 건 아님)였고, 나머지는 음료수와 츄러스였다. 엄청난. 나는 결국 휴대폰을 꺼냈다.

R1이 이러한 타사 서비스에 연결되면 로드하는 데 시간이 걸릴 수 있다는 경고가 표시됩니다. DoorDash가 열릴 때까지 기다렸다가 아주 적은 수의 옵션을 스크롤하는 것은 정말 말도 안되는 일입니다. 스마트폰을 이용해보세요! R1에 대한 Lyu의 전체적인 주장은 그가 사용하기 귀찮다고 생각하는 앱을 사용하는 대신 R1을 사용하여 음성만 사용할 수 있다는 것입니다. 하지만 이런 경험이라면 대신 내 앱과 빅 스크린 스마트폰을 선택하겠습니다. 감사합니다.

그런데 스마트폰으로 Rabbithole에 접속하면 이러한 서비스를 R1에 연결할 수 없습니다. 현재는 데스크톱에서만 작동합니다. 얼마나 모바일이 좋은지.

R1의 모든 기능과 상호 작용하는 기본 방법은 스크롤 휠을 누른 다음 측면 버튼을 눌러 선택하는 것입니다. 불행히도 스크롤 기능이 일관성이 없습니다. 예상한 것만큼 빠르게 스크롤되지 않고, 햅틱 피드백도 없으며, 다음 선택 항목으로 이동하려면 너무 많이 스크롤해야 합니다. 이렇게 제한된 기능을 갖춘 장치에서 Rabbit이 어떻게 이 기능을 제대로 수행하지 못했는지는 정말 놀랍습니다. 거래량 변경하는 것조차 어려운 작업 이며, R1에 거래량 낮추라고 요청하면 "R1 장치의 거래량 조정할 수 없습니다."라는 결과가 나옵니다.

Humane Ai Pin 리뷰를 보면 여기에 대규모 언어 모델의 문제가 있으며 주로 부정확한 정보가 있습니다. 4월 24일에 나는 Rabbit R1에게 다음 개기 일식이 언제인지 물었고, 그것은 도움이 되지 않지만 2024년 4월 8일이라고 대답했습니다. 마침내 가장 가까운 커피숍이 무엇인지 답을 얻었지만 2.5마일 떨어진 장소에 대해 언급했습니다. 저는 몇 블록 떨어진 곳에 커피숍이 여러 군데 있습니다.

인정하겠습니다. 정답을 얻으면 정말 인상적입니다. 점검 서비스를 제공할 자동차 정비소가 있는지 물었고, 수십 건의 사용자 리뷰를 살펴본 결과 정확하게 그렇다고 대답했습니다. 문제는 이러한 답변 중 일부가 너무 길고 R1이 때때로 귀하가 찾고 있는 정보로 응답을 이끌어내지 못한다는 것입니다. 그냥 예 또는 아니오라고 말하세요!

비전 기능을 사용하면 R1의 카메라에 앞에 무엇이 있는지 보고 이에 대한 정보를 제공하도록 요청할 수 있습니다. 이것은 꽤 잘 작동합니다. 내 개를 설명하고 내 아내를 젊은 여성이라고 불렀고 그녀는 기뻐했으며 저는 "중년 남성"이라고 설명했습니다. 그녀는 그 말에 좀 너무 심하게 웃었다.

뉴욕시에서 열린 R1 출시 행사에서 Lyu는 R1이 인쇄된 스프레드시트가 있는 종이를 보게 하는 예를 시연했습니다. 그는 R1에게 두 개의 열을 교체하고 그 결과를 이메일로 보내달라고 요청했습니다. 종이에 스프레드시트는 없었지만 이메일로 보내고 싶은 자동 검사 보고서가 있었습니다. R1에 물었더니… 내 이메일 주소가 없다고 하더군요. (내 이메일 정보로 Rabbit 계정을 설정했습니다.) 이에 대해 회사에 문의했는데 R1은 아직 스프레드시트 이외의 문서를 지원하지 않는다고 들었습니다. 엄청난. 그래서 스프레드시트를 인쇄하고 두 개의 열을 바꾸도록 요청한 다음 이메일로 보냈더니 이런 일이 일어났습니다. 두 개의 열을 바꿨지만 어떤 이유로 종이에 있던 다른 여러 열은 포함되지 않았습니다.

나는 Kazuo Ishiguro의 Klara and the Sun 사본을 집어들고 R1에게 그것을 보고 내용에 대해 말해 줄 수 있는지 물었습니다. 대신 R1은 표지에 대해 설명하고 그것이 소설 작품일 가능성이 있다고 말했습니다. 이름을 읽을 수 있다면 동시에 조사하고 개요를 제공할 수 없는 이유는 무엇입니까? Humane Ai Pin조차도 이것을 할 수 있습니다.

R1이 메모를 작성하고 Rabbithole에서 이러한 메모를 편집하도록 할 수도 있지만 미리 알림 기능은 없습니다. 그리고 래빗홀이 시간이 지나도 계속 로그아웃되는 게 짜증나서, 메모를 확인하고 싶을 때마다 먼저 로그인을 해야 하는 경우도 있었습니다. 음성 녹음도 있으며 R1은 작동할 때 멋진 테이프 레코더 애니메이션을 재생합니다. 안타깝게도 녹음 자체의 품질이 낮고 소리가 잘 들리지 않습니다. 하지만 녹음 내용이 요약 되어 있으며 WAV 파일을 다운로드할 수 있습니다.

Humane Ai Pin과 마찬가지로 번역 기능도 좋습니다. 특정 언어를 번역해 달라고 요청하면 이제 서로 대화를 나눌 수 있습니다. R1은 번역 언어를 자동으로 변경하므로 내가 영어로 말하면 스페인어로 변경됩니다. 내 건너편 사람이 스페인어를 말하면 영어로 바뀐다.

이 모든 것들이 꽤 잘 작동하는 또 다른 것이 무엇인지 아십니까? 스마트폰! 이것은 누군가에게 R1을 보여줄 때마다 받았던 질문이기도 합니다. “왜 그냥 앱이 될 수 없나요?”

나는 오픈소스 인공지능을 연구하고 있는 Cornell Tech의 박사후 연구원인 David Widder 에게 이 질문을 던졌습니다. “하드웨어는 훌륭합니다. Apple과 Google에 너무 많은 돈을 주어야 하는 것에 대한 앱 개발자들의 좌절감이 커지고 있습니다. 내 생각엔 '우리는 그들에게 얽매이지 않고 우리 자신의 일을 하고 싶다'는 생각이 비트(Bit) 있는 것 같아요."

그것은 공평하지만 R1은 아직 준비가 되지 않았습니다. 이번 리뷰는 건너뛰고 좀 더 경험적인 이야기를 쓸까 고민했는데, 지금 당장 누구나 구매할 수 있는 제품입니다. 한 회사에서 베타 테스터가 되기 위해 200달러를 청구하고 있습니다. Rabbit에는 특정 작업을 수행하도록 R1을 교육할 수 있는 학습 모드를 포함하여 기능과 서비스에 대한 로드맵이 있지만 지금은 이를 구입할 이유가 없습니다. 기능이 더 풍부하고 정말 유용할 때 다시 방문하고 원할 경우 구매하세요.

최소한 다른 리뷰어들을 괴롭히는 배터리 문제는 없었습니다. R1은 빠르게 충전되었으며 대기 모드에서도 배터리가 너무 빨리 소모되지 않았습니다. 하지만 사용하면 배터리가 상당히 빨리 소모됩니다.

결국 가장 큰 문제는 이제 기기를 두 개나 들고 다녀야 한다는 점으로 귀결된다. 저는 WIRED의 상주 스마트폰 리뷰어이고 두 대의 휴대폰을 가지고 다니는 것을 싫어합니다. 그래서 테스트하는 새 장치마다 항상 개인 SIM을 장착합니다. 지난 주 동안 저는 억지로 R1을 사용했지만 결국에는 대신 휴대폰을 사용하게 되는 경우가 많았습니다. (이상하게도 휴메인 아이핀은 착용이 가능해서 주머니에 넣거나 들고 다닐 필요가 없어서 더 좋았습니다.)

Rabbit은 R1이 휴대폰을 대체하지는 않을 것이라고 분명히 말했지만, 스마트폰에서 동일한 작업과 훨씬 더 많은 작업을 모두 수행할 수 있다면(Google의 제미니(Gemini) R1보다 더 나은 결과는 아니더라도 동일한 결과를 제공했습니다), 저는 더 이상 할 일이 없습니다. 그것을 사용하는 이유. 적어도 그것은 예뻐 보인다. 점점 늘어나는 AI 기반 문진 컬렉션에 추가하겠습니다.

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
1
즐겨찾기에 추가
코멘트