Baidu Search DeepSeek 전체 버전 테스트: "내 이익을 위해 사용하세요" 또는 "있는 그대로 받아들이세요"?

이 기사는 기계로 번역되었습니다
원문 표시
현재 바이두 검색은 DeepSeek 최신 버전을 전면 도입하고 온라인 서비스를 제공하고 있으며, PC 버전은 오픈 1시간 만에 천만 명 이상이 사용했습니다.

이미지 출처: 무경계 AI 생성

2월 16일 바이두 검색이 DeepSeek와 Wenxin 대모델의 최신 심층 검색 기능을 전면 도입한 이후, 현재 바이두 검색은 DeepSeek 최신 버전을 전면 도입했습니다.

현재 사용자는 바이두 앱에서 어떤 검색어를 입력하든 검색 결과 페이지에서 "AI+"를 클릭하여 AI 검색으로 들어가고, 하단의 "최신 버전 체험하기"를 클릭하면 DeepSeek와 대화할 수 있습니다. 또한 PC 버전 바이두 AI 검색도 DeepSeek R1 최신 버전을 도입하고 온라인 기능을 제공하고 있습니다.

바이두 AI 검색의 DeepSeek 최신 버전 성능은 어떨까요? 수십 번의 테스트 끝에 감탄을 금할 수 없습니다: 바이두 AI 검색은 정말 최고 수준입니다! DeepSeek 최고 모델 기능을 도입한 바이두 AI 검색은 새로운 세계의 문을 열었습니다.

"내 것으로 만들기" vs "가져다 쓰기"

DeepSeek를 도입한 후, 바이두는 이를 축소하지 않고 서버 리소스도 충분히 제공했습니다. 이는 바이두의 "내 것으로 만들기" 전략이며, 단순히 DeepSeek를 가져다 쓰는 것이 아닙니다. 바이두에는 자체적인 "진짜 것"이 있습니다.

이 "진짜 것"은 무엇일까요? 이는 바이두의 깊이 있는 기술 융합과 RAG 기술 우위를 통해 사용자의 실제 문제를 해결하는 데 직접 반영됩니다. 결국 이는 바이두 25년간의 데이터 축적입니다. 세계 최대 중문 검색 엔진인 바이두는 PC 인터넷에서 모바일 인터넷, 그리고 AI 시대에 이르기까지 다차원적인 사용자 검색 행동 데이터, 웹페이지 색인 데이터, 콘텐츠 생태계 데이터를 축적했습니다. 이는 새로운 AI 검색이 쉽게 복제할 수 없는 "시간적 진입장벽"입니다.

25년 시간 범위의 문제를 한번 살펴보겠습니다: 지난 25년간 중국 신에너지 산업의 발전 과정을 자세히 설명하고, 주요 시점과 그 영향 및 의미를 포함하시오. DeepSeek-R1 최신 버전의 바이두 AI 검색이 제공한 답변은 다음과 같습니다:

답변에는 중국 신에너지 산업 25년 발전 역사가 자세히 기술되어 있으며, 이를 단계별로 구분했습니다. 일부 데이터는 다른 AI 검색 엔진에서는 찾아볼 수 없습니다.

이 문제를 검색하는 과정에서 바이두 AI 검색은 "특색 영감 영역"이라는 새로운 기능을 선보였습니다. 이 기능은 현재 질문에 맞는 영감 콘텐츠를 제공하여 사용자가 문제의 맥락을 정리할 수 있도록 돕습니다. 영감 영역의 어떤 문제라도 클릭하면 해당 질문을 바로 제출할 수 있습니다.

주목할 점은, 현재 대부분의 AI 검색 제품들은 모델의 "사고" 과정을 보여주지만, 이는 주로 "XXX개 웹페이지 검색 중"과 같은 형태입니다. 하지만 DeepSeek R1 최신 버전이 탑재된 바이두 AI 검색은 문제를 세부적으로 분해합니다. 예를 들어 입력 프롬프트: 2010년부터 2015년까지 전 세계 GDP 순위 변화 추이를 제공하시오. 구체적인 수치와 변화 과정을 보여주세요.

데이터 출처의 신뢰성 확인부터 명목 GDP인지 구매력 평가(PPP) 조정 GDP인지 범위 설정, 과거 데이터 검색 및 순위 매기기 등, 마치 사람의 뇌가 문제를 단계별로 분석하는 과정과 유사합니다.

놀라운 점은 DeepSeek R1 최신 버전의 바이두 AI 검색이 각종 세부 사항과 특수 상황을 모두 고려한다는 것입니다. 예를 들어 각국 GDP 실제 성장률과 변동성, 환율 변동 영향, 데이터 처리 시 반올림 부분 등을 모두 고려했습니다. 이는 제가 생각하지 못했던 부분입니다. 감탄을 금할 수 없습니다: DeepSeek R1 최신 버전의 바이두 AI 검색은 정말 종합적이군요!

이 문제에 대한 완전한 답변은 다음과 같습니다. 어떤 힌트도 없이 자동으로 표 형식으로 결과를 제시하고, 주요 사건에 대해서는 명확한 설명을 제공했습니다.

바이두 RAG와 DeepSeek-R1의 결합으로 과연 환상 수준이 낮아졌을까요? 다음 문제로 바이두 AI 검색 DeepSeek 최신 버전의 환상 수준을 테스트해 보겠습니다: 2005년 2월 20일의 전 세계 주식 시장 종가 데이터를 제공하세요.

이 문제의 까다로운 점은 2005년 2월 20일이 일요일이라는 것입니다. 대부분의 국가에서는 일요일에 주식 시장이 휴장이죠. 만약 모델에 환상이 있다면 다른 날짜의 데이터를 2005년 2월 20일에 맞춰 제공할 것입니다. 하지만 바이두 AI 검색의 DeepSeek 최신 버전은 다음과 같이 생각했습니다:

사고 과정을 보면 문제를 정확히 분석하고 있으며, "엉터리로 말하지" 않고 있습니다. 제공한 답변도 엄격하고 정확합니다.

이를 기반으로 문제 난이도를 높여 2005년 2월 18일 유럽 시장의 시간별 데이터를 요구해 보겠습니다. 이는 답변의 세부 수준을 더 높게 요구합니다. 바이두 AI 검색 DeepSeek R1 최신 버전의 답변은 다음과 같습니다:

바이두의 오랜 기간 축적된 전문 데이터도 두 기술의 결합을 통해 더 잘 발휘되고 있습니다. 전문 질문으로 접근해 보겠습니다: 중국 의약품 가격 형성 메커니즘과 영향 요인을 자세히 설명하고, 현재 정책 환경을 고려하여 의료보험 약가 협상의 역할과 의의를 설명하시오.

이 문제는 의료 분야의 약가 문제를 다루며, 모델의 특정 분야 전문성과 성숙도를 테스트합니다. 또한 현재 정책 환경을 고려하도록 요구하여 모델의 시의성 있는 정보 포착 능력도 평가합니다. 답변은 다음과 같습니다:

답변에는 PD-1 억제제 연간 치료비용이 30만 위안에서 5-10만 위안으로 하락, 74종의 신약이 의료보험 목록에 포함되면서 CAR-T 요법이 120만 위안에서 33만 위안으로 하락했다는 등의 구체적인 데이터 세부 사항이 포함되어 있습니다. 이는 모델이 의료 약품이라는 전문 분야의 데이터를 상당히 축적했음을 보여줍니다.

DeepSeek-R1은 바이두 AI 검색의 추론 능력을 한층 더 높였습니다. 동시에 바이두 AI 검색 자체도 자신의 장점을 발휘하여 멀티모달 기능을 DeepSeek 대형 언어 모델에 결합했습니다. 프롬프트 입력: 저는 미래 도시를 주제로 한 그래피티 일러스트레이션 대회에 참가하려고 합니다. 신비로운 숲, 마법의 성, 외계 생명체, 요정과 거인 등 판타지 요소가 가득한 세계를 창조해 주세요. 이미지를 제공해 주세요. 이 문제에는 여러 가지 장면 주제가 포함되어 있어, 대형 언어 모델의 능력으로 이해하고 이미지 모델로 생성해야 합니다. 최종 결과 이미지는 다음과 같습니다:

DeepSeek-R1 최신 버전을 탑재한 후, 바이두 AI 검색의 코드 능력도 한 단계 더 발전했습니다. 프롬프트 입력: 애니메이션 <하늘의 자객 哪吒>의 흥행을 축하하는 이미지를 생성하고, 哪吒 캐릭터를 포함시켜 주세요. 생성된 코드와 결과를 확인해 주세요. 답변은 다음과 같습니다:

이 답변에는 완성된 코드와 실행 파일이 포함되어 있을 뿐만 아니라, 시각적 요소 검증, 애니메이션 테스트, 호환성 테스트 등의 검증 설명과 효과 개선을 위한 추가 코드도 제공되어, 사용자가 직접 조정할 수 있습니다.

사용자 가치 회귀, 기술 고립 탈피

오늘날 중국 인공지능 발전사를 돌이켜보면, 2010년 초반부터 NLP, 지식 그래프, 기계 학습 등 핵심 기술 개발에 주력해

출처
면책조항: 상기 내용은 작자의 개인적인 의견입니다. 따라서 이는 Followin의 입장과 무관하며 Followin과 관련된 어떠한 투자 제안도 구성하지 않습니다.
라이크
즐겨찾기에 추가
코멘트