准备数据、训练模型和构建用户体验
- 准备数据:机器需要大量高质量的数据来学习。例如,要将文本转换为图像,ML 模型需要从数百万张带有文本标签的图像中学习。ML 工程师通常花费 80% 的时间在称为特征工程的过程中手动清理数据。
- 训练模型:接下来,ML 工程师将数据拆分为训练集和测试集。机器使用训练集来构建模型,然后使用测试集来提高模型的准确性。
- 建立用户体验:在训练模型之后,团队需要建立一个用户UX体验,人们可以在其中提供输入以获得他们想要的输出。即使对于 ML 工程师来说,模型的工作原理也是一个黑匣子,因此用户体验需要清晰、可信且可操作。
机器学习进一步分为三大类:监督学习(通过标注数据进行训练,如图像分类)、无监督学习(从未标注的数据中发现模式,如聚类)和强化学习(通过与环境互动获得奖励进行优化,如游戏AI)。这三类学习方法构成了现代AI的核心算法基础。
2.3.2 深度学习(Deep Learning)
深度学习是一种基于神经网络的机器学习技术。其中的主要特点是能够自动学习数据的特征,通过将特征学习任务交给模型进行训练来实现自动学习过程。
深度学习历史发展
通过神经网络的多层结构提取数据中的高级特征,特别适合处理非结构化数据(如图像、语音、文本),适用于图像识别、自然语言处理、医疗影像分析等场景。
2.3.3 自然语言处理(Natural Language Processing, NLP)
NLP是让计算机理解、处理和生成人类语言的技术,通过分析文本或语音进行语义理解和响应。
近年来,NLP技术取得了显著进展,特别是在生成式预训练模型(如BERT、GPT-3)推动下,AI在语言理解和生成方面表现出色。这些模型利用大量文本数据进行训练,能够生成自然的、连贯的文本,应用于聊天机器人、智能客服、语言翻译、内容生成等场景。
2.3.4 计算机视觉(Computer Vision)
计算机视觉是通过计算机算法让机器“看懂”图像或视频,自动从视觉数据中提取信息。
计算机视觉主要用于物体检测和跟踪、图像识别和处理、动作识别等,应用场景包括自动驾驶、安防监控、医疗影像分析、零售和广告等。
2.3.5 强化学习(Reinforcement Learning)
强化学习是一种通过与环境交互获得反馈(奖励或惩罚),进而优化决策的技术。通过与环境的互动来学习策略,使得AI系统通过试错法获得最大回报。在每一步操作后,系统会收到奖励或惩罚,通过长期的反馈来优化决策。
强化学习主要用于训练AI智能体在动态环境中进行最优决策,应用场景包括游戏AI(如AlphaGo)、自动驾驶、机器人控制等。
Google DeepMind在Nature发表的文章《Human-level Control through Deep Reinforcement Learning》首次实现了End-to-End的深度强化学习模型Deep Q-Networks,它的输入是游戏画面的像素值,而输出是游戏的控制命令,它的原理如下图所示。
2.3.6 生成式AI(Generative AI)
生成式AI是通过机器学习模型生成新的、与训练数据相似的内容,如图像、文本或视频。
生成式AI技术正在改变创意产业,推动艺术、娱乐、广告等领域的创新,其应用场景包括艺术创作、图像生成、游戏设计、稳步生成等。
2.3.7 大数据与数据处理
大数据技术用于处理和分析大量的数据,尤其是在AI中用于数据预处理、特征提取、模型训练等任务。
通过大数据技术,能为AI模型提供有效的训练数据,提升模型的准确性和预测能力。应用场景包括电商分析、市场预测、情感分析、趋势分析预测等。
2.3.8 AI硬件加速(GPU/TPU/NPU)
AI硬件加速技术通过使用专用硬件(如GPU、TPU、NPU)加速神经网络训练和推理过程。
其应用场景包括深度学习模型训练、智能设备AI计算、数据中心等。
3 AI的市场、应用场景和商业模式
3.1 AI行业的市场规模:
全球人工智能(AI)市场正快速扩张,尤其自ChatGPT发布后,增长势头显著。2023年全球AI市场规模估计在3000亿至4000亿美元之间。
据Precedence Research预测,2024年全球AI市场规模为6382.3亿美元,并将在2034年达到36804.7亿美元,CAGR为19.1%,凸显了该领域的巨大潜力和持续的强劲发展。
推动这一增长的因素包括企业对自动化和数据驱动决策的需求增加,政府对AI技术的投资和支持,以及AI技术的不断成熟和广泛应用(从传统的互联网行业扩展到金融、医疗、教育、制造等各个领域)。
3.2 AI的应用场景
依托于AI的几大关键能力(图像识别、语音识别、自然语言处理、具身智能),AI技术被应用于各个垂直领域,如医疗(如AI诊断工具)、金融(如风险评估与算法交易)、零售(如推荐系统)、制造(如智能工厂),解决行业特定的问题,提升运营效率,创造新的商业模式。
- 医疗领域:AI在医疗领域的应用正逐渐成熟并扩展至多个方面,包括诊断、个性化治疗、药物研发和健康管理等。AI通过分析大量的医疗数据(如病历、基因序列、影像数据),可以辅助医生进行疾病的早期诊断、精准治疗决策,并加速新药研发的过程。例如,放射学中的AI工具能够帮助医生识别早期癌症迹象,AI驱动的基因分析可以为患者提供个性化的治疗方案。AI在医疗领域的应用不仅提高了诊断的准确性和治疗的效率,还显著降低了医疗成本,特别是在资源有限的环境中,AI技术可以极大地改善医疗服务的可及性。
- 金融领域:在金融行业,AI被广泛应用于风险管理、算法交易、客户服务和欺诈检测等领域。AI通过分析海量的市场数据和历史交易记录,能够实时预测市场趋势并执行高频交易策略,提高了投资回报率和市场效率。此外,AI还被用于开发智能投顾服务,帮助个人投资者根据其财务状况和风险偏好制定投资策略。AI驱动的反欺诈系统则通过监控交易模式,及时发现异常交易行为,降低金融机构的损失。
- 教育领域:AI在教育领域的应用正在改变传统的教学模式,推动个性化学习的发展。通过分析学生的学习行为数据,AI可以为每个学生量身定制学习内容和路径,帮助学生在适合其学习速度和理解能力的节奏下学习。AI还被用于开发自动化的作业批改和考试评分系统,减轻教师的工作负担,并提供实时反馈。此外,AI驱动的教育平台可以根据学生的表现和兴趣,推荐适合的学习资源和课程,提升学习效果。
- 零售与电商领域:在零售和电商领域,AI通过个性化推荐系统、库存管理优化、客户关系管理(CRM)等方式,帮助企业提高销售额和客户满意度。AI分析客户的购物行为和偏好,能够精准推荐商品,增加销售转化率。
- 供应链管理:在供应链管理方面,AI通过预测需求波动,优化库存管理,减少商品缺货或过剩的情况。此外,AI驱动的聊天机器人和虚拟助理提升了消费者的购物体验,为他们提供24/7的个性化服务。
- 智能产品和设备:AI技术被广泛应用于智能家居设备、无人驾驶汽车、无人机、机器人等智能产品中。这些产品通过AI实现自动化、个性化的功能,显著提升了用户体验。例如,AI驱动的智能音箱(如Amazon Echo、Google Home)不仅能执行语音命令,还能学习用户的习惯,提供更贴心的服务。
- 自动驾驶:自动驾驶技术是AI在智能设备中的一大亮点。通过深度学习模型和传感器数据融合,自动驾驶系统能够在复杂的道路环境中做出实时决策,提高行车安全性和效率。
3.3 AI商业模式
AI的商业模式多种多样,主要的包括软件即服务(SaaS)、数据分析服务、AI驱动的产品(如智能设备)等。企业通过提供AI解决方案来简化流程、提高效率,从而实现盈利。
- 软件即服务(SaaS):AI SaaS平台提供基于云的AI服务,企业用户可以按需订阅这些服务,而不需要自行开发或维护AI基础设施。例如Google的AI平台、Amazon的AWS AI服务、Microsoft Azure的AI工具、OpenAI的ChatGPT等,用户可以通过API调用这些服务(包括机器学习、自然语言处理、计算机视觉),并按使用量支付费用。
- AI硬件销售:AI硬件厂商如英伟达等研发了AI专用芯片,通过为各类厂商和用户提供AI芯片算力来获得销售收入。英伟达的AI芯片客户包括CSP厂商(微软、亚马逊、谷歌等)、互联网、消费级科技公司(Meta、特斯拉等)。
- 数据分析服务:AI数据分析公司通过分析企业的数据,为其提供有价值的商业洞见,帮助优化业务流程和决策。例如Palantir等公司通过分析庞大的数据集,帮助企业识别模式、预测市场趋势,并制定更有效的战略。这类服务通常采用咨询或按项目收费的方式。
- 智能设备:AI技术被嵌入到各种硬件产品(如智能音箱、无人机、自动驾驶汽车等)中,这些设备通过AI实现关键功能并创造独特的用户体验。例如,Tesla的自动驾驶系统、Amazon的Echo智能音箱等,都是通过AI技术赋能的产品。这些智能设备不仅通过销售硬件盈利,还可能通过附加的服务或内容订阅获取持续收入。
- AI应用产品服务:基于AI大语言模型(如GPT-4、Codex等)开发典型应用场景的AI应用,企业和用户通过订阅AI服务来使用这些AI应用产品。例如OpenAI推出了ChatGPT,帮助用户生成内容、文章、问答等;MidJourney为艺术家和设计师提供生成不同风格艺术图像的能力;Runway提供AI视频编辑功能,使用户可以自动生成视频片段、应用风格转换、并进行快速的编辑。DoNotPay提供自动化法律服务,帮助用户处理诸如停车罚单上诉、申请退款等简单的法律事务,大大降低了法律服务的门槛。
4 AI的产业链图谱与典型公司
4.1 AI产业角色
推动AI发展的主要玩家包括大型硬件公司(英伟达)、大型科技公司(如Google、Microsoft、Amazon),以及一系列AI初创企业。这些公司在数据处理能力、算法开发和市场应用方面均处于领先地位,推动着整个AI生态系统的发展。
- 硬件公司:如英伟达等硬件厂商,推出了GPU和AI芯片,AI芯片可以支持深度神经网络的学习和加速计算,为AI提供算力支撑。
- 科技巨头:如Google、Microsoft、Amazon等在AI领域投入了大量资源。它们不仅开发了强大的AI平台,还积极投资于AI初创公司,并通过并购扩展其AI生态系统。这些公司拥有丰富的数据、强大的计算资源和顶尖的人才,能够引领AI技术的发展方向。
- AI初创公司:AI初创公司(如OpenAi、Nuro、Vicarious等)往往专注于特定领域的创新,如医疗AI、自动驾驶AI、金融AI等。这些公司具有灵活性和创新精神,能够快速响应市场需求,开发出具有竞争力的产品和服务。初创公司通常通过风险投资获得资金,并在短时间内实现快速增长,成为市场中的重要力量。
- 学术机构和研究组织:全球各地的大学和研究机构(如MIT、DeepMind、BAIR等)也是AI技术发展的重要力量,他们不断进行前沿研究,并通过开放源代码和学术论文推动行业进步。同时培养了大量AI领域的专业人才。通过开放源代码和学术出版物,这些机构促进了知识的传播和技术的普及。
4.2 AI产业链图谱
AI产业链从上游的硬件提供商(如芯片制造商)到中游的软件开发和平台提供,再到下游的应用场景落地,构成了一个庞大且复杂的生态系统。每一个环节都有多个关键参与者,共同推动AI技术的进步和应用的广泛化。
4.2.1 上游:基础设施层
上游部分包括硬件制造商和云服务提供商。
- 硬件制造商:提供AI计算所需的硬件支持,包括CPU、GPU、TPU和专用AI加速器等。NVIDIA、AMD、Intel,以及最近兴起的专用AI芯片制造商(如Tesla的FSD芯片)都是这一层的重要玩家。
- 云服务提供商:如Amazon Web Services (AWS)、Google Cloud、Microsoft Azure等。这些公司提供大规模的基于云的计算资源和AI开发平台,支持企业进行AI模型的开发、训练和部署。云服务的普及降低了AI开发的门槛,使得中小企业也能够利用AI技术。
4.2.2 中游:平台和工具层
中游部分包括AI模型研发公司、软件开发平台、数据服务和管理工具。这一层级为整个生态系统提供了算法、平台和数据支持,推动了AI技术的普及与实际应用。
- AI模型研发公司:专注于开发和训练大型AI模型,提供基础的算法与模型供企业和开发者使用。这些公司推动了人工智能技术的前沿研究,并通过API或平台的形式使其成果得以商用化。代表性公司如OpenAI、Google DeepMind、Anthropic和Cohere,这些公司开发了大型语言模型(LLM)如GPT、BERT等,用于自然语言处理、生成式AI等任务。
- AI软件开发平台:为开发者提供了构建、训练和部署AI模型的工具。这些平台提供了灵活的框架,让开发者可以轻松地开发并部署AI模型。这些平台不仅支持高性能的模型训练,还能与硬件加速器(如GPU、TPU)结合,提升模型的训练效率。代表性开源平台如TensorFlow、PyTorch、Keras、Hugging Face等,支持开发者创建、训练各种深度学习模型,并能够将模型应用于从学术研究到商业应用的多个场景。
- 数据服务与管理工具:数据是AI模型训练的核心,企业需要大量数据来训练AI模型。数据服务与管理工具帮助企业高效管理和处理大规模数据。数据服务公司如Snowflake和Databricks,提供了大数据处理和分析工具,帮助企业管理结构化和非结构化数据。此外,数据标注服务公司(如Scale AI)为AI模型提供高质量的训练数据,确保模型的准确性和可靠性。
4.2.3 下游:应用场景落地与服务层
下游部分包括AI在各个行业的实际应用场景,基于AI技术的智能产品和服务,以及为AI技术落地提供咨询服务和运营维护的服务公司。
- 垂直领域AI应用:AI技术被应用于各个垂直领域,如医疗、金融、零售、制造等,为不同行业带来了定制化的解决方案。例如,在医疗领域,AI诊断工具如IBM Watson Health和Zebra Medical Vision,通过分析医学影像和电子病历,帮助医生更快、更准确地诊断疾病。在金融领域,AI被应用于风险评估、欺诈检测和算法交易,典型案例包括Kensho和Darktrace,它们利用AI提高金融数据分析的效率,并增强安全性。在零售行业,AI驱动的推荐系统如Amazon的个性化推荐引擎,通过分析用户行为和偏好,提升了在线购物的体验。在制造业,AI应用于智能工厂,通过自动化设备和预测性维护优化生产流程,Siemens和GE的Predix平台是其中的代表性公司,它们通过AI技术帮助工厂提高生产效率并降低运营成本。
- 智能产品和设备:AI技术被广泛应用于各种智能产品和设备中,推动了自动化和个性化功能的发展,显著提升了用户体验。例如,在智能家居领域,AI驱动的设备如Amazon Echo和Google Home,不仅能够执行语音命令,还可以通过学习用户的日常习惯,提供个性化的服务,如自动调整家中灯光、温度等环境设置。在无人驾驶汽车领域,Tesla和Waymo等公司依靠AI技术开发自动驾驶系统,通过摄像头、传感器和深度学习算法,实现车辆的自动化驾驶和道路导航。在无人机领域,DJI等公司使用AI技术提升无人机的自主飞行和目标追踪能力,广泛应用于拍摄、物流运输和基础设施检查等领域。机器人领域的代表如Boston Dynamics,利用AI技术为机器人提供感知和决策能力,使其在复杂环境中执行任务,如仓储自动化和危险环境操作。
- AI咨询服务和运营维护公司:负责将AI技术的应用落地到企业的实际业务中,并提供长期的支持和优化。这些公司为企业提供从AI战略咨询、技术实施到模型维护的全方位服务,是推动AI技术在不同行业中应用和发展的关键环节。如IBM Watson、Accenture等提供AI咨询服务,帮助企业制定AI战略,实施AI解决方案。AI模型和系统在部署后需要不断维护和优化,这催生了AI运营服务市场(MLOps),如DataRobot、Algorithmia等公司,专注于为企业提供AI模型的监控、维护和优化服务。
4.3典型AI公司(中上游)
4.3.1 英伟达NVIDIA
NVIDIA(英伟达)成立于1993年,是一家全球领先的图形处理器(GPU)制造商,最初以开发PC游戏图形卡闻名。如今,NVIDIA不仅在图形处理方面保持行业领先地位,还在人工智能(AI)、高性能计算(HPC)、自动驾驶、数据中心和云计算等多个领域取得了重要突破。
业务领域:NVIDIA是全球领先的图形处理器(GPU)制造商,同时在AI领域发挥了重要作用。NVIDIA提供AI硬件(如GPU、CUDA并行计算架构)和软件平台(如NVIDIA AI和Deep Learning SDK),其GPU被广泛用于自动驾驶、数据中心、医疗AI、图像处理等多个领域。
- GPU(图形处理器):NVIDIA最早以其GeForce系列图形卡闻名,专注于游戏、图像处理、3D渲染等领域,广泛应用于个人电脑、游戏机和工作站。GPU现已成为AI模型训练和推理的核心硬件,尤其是在深度学习中,NVIDIA的GPU因其强大的并行计算能力而被广泛应用。
- AI与机器学习:NVIDIA的GPU和CUDA(并行计算架构)成为人工智能和深度学习领域的标准硬件,帮助大规模AI模型实现高效训练和推理。
- NVIDIA AI平台:NVIDIA提供的软件工具(如NVIDIA AI、NVIDIA TensorRT),支持开发者和企业加速AI模型的开发和部署。
- NVIDIA DRIVE:NVIDIA推出了针对自动驾驶的NVIDIA DRIVE平台,提供从感知、决策到自动驾驶系统的完整解决方案,已与多家汽车制造商合作,推动自动驾驶技术的应用。
- NVIDIA Jetson平台:Jetson是为机器人和物联网(IoT)设备设计的边缘AI平台,支持本地AI处理,应用于智能城市、工业自动化和智能设备等领域。
商业模式:NVIDIA的商业模式依赖于硬件销售、软件平台和生态系统的构建。NVIDIA通过销售GPU硬件获利,主要分为消费者级(GeForce系列)、专业级(Quadro系列)、数据中心(Tesla系列)和AI计算(A100等)四大类别。通过软件工具与平台(NVIDIA AI、TensorRT、Omniverse等)为开发者和企业提供AI开发和优化支持,同时NVIDIA通过软件订阅和开发工具获得收入。
据估计,英伟达在过去 7 年间牢牢占据数据中心 GPU 市场 90% 以上的份额。2023 年,其份额更是达到 98%,所有大型数据中心的运转和大模型训练,都需要依赖于英伟达研制的 GPU。
4.3.2 OpenAI和ChatGPT
OpenAI成立于2015年,由特斯拉(Tesla)和SpaceX创始人埃隆·马斯克(Elon Musk)创立,是美国一家人工智能研究机构,致力于开发通用人工智能(AGI),以确保其安全性并为全人类带来最大利益。OpenAI最初作为一个非营利组织,后来转变为“有限盈利”的商业模式,吸引了微软等大型科技公司的投资。其目标是通过研究和开发AI技术,推动AGI的发展,同时关注AI的安全性、伦理和可控性。
业务领域:核心业务围绕AI模型的研发,尤其是大型语言模型(LLM)和生成式AI,广泛应用于自然语言处理、生成式内容等多个领域。OpenAI还通过API服务提供商业化AI模型的访问。
- GPT:GPT(Generative Pre-trained Transformer)系列模型是其核心产品之一,GPT-3和最新的GPT-4等模型展示了强大的自然语言生成能力。
- DALL·E:OpenAI开发的生成式AI模型,能够根据文本描述生成高质量的图像。它在设计、广告、创意产业等领域具有广泛应用前景。
- Codex:基于GPT的编程语言生成器,能够理解自然语言指令并生成相应的代码,已应用于GitHub Copilot,帮助开发者进行自动代码生成和编写。
- OpenAI API:OpenAI提供商业化的API服务,允许开发者和企业基于其AI模型构建应用程序。通过API,企业可以轻松调用GPT、DALL·E、Codex等模型,应用于各种业务场景,如自然语言处理、内容生成和自动化工作流。
商业模式:围绕提供AI模型的API访问以及通过与大型科技公司合作来盈利。
- OpenAI API:OpenAI的核心商业模式是通过其API平台提供GPT、DALL·E、Codex等模型的访问权限,开发者和企业可以订阅这些服务,按需使用其AI模型进行自然语言处理、图像生成、自动化编程等任务。
- 技术许可与授权:OpenAI与其他公司合作,授权其技术和模型,用于产品集成和应用开发。通过这种授权,OpenAI能够扩展其技术影响力,并为企业提供定制化的AI解决方案。
OpenAI的技术已经在全球范围内产生了深远影响,特别是在AI内容生成和自动化领域。通过其开放的API平台,OpenAI为数以千计的公司提供AI解决方案,推动了自然语言处理、自动化创作、编程等领域的创新。
4.3.3 Tesla:
Tesla成立于2003年,是全球知名的电动车制造公司,专注于开发和生产电动汽车、能源存储系统和太阳能产品。除了电动车业务,Tesla在人工智能(AI)和自动驾驶技术方面也处于行业前沿,其AI驱动的自动驾驶系统和自主研发的AI硬件使其在汽车行业具备了独特的竞争优势。
业务领域:Tesla的业务不仅限于电动汽车,还包括自动驾驶、能源解决方案和AI硬件开发等多个领域。特斯拉在人工智能领域搭建了强大的基础设施,包括AI芯片(FSD Chip全自动驾驶芯片;Dojo Chip,Dojo训练芯片)、Dojo超级计算机和AI数据中心,为自动驾驶和机器人业务提供底层技术支撑。
- 电动汽车:Tesla的核心业务是生产和销售电动汽车,包括Model S、Model 3、Model X和Model Y等车型。它们凭借高性能、长续航和自动驾驶功能,在全球电动车市场中占据重要位置。
- 全自动驾驶技术:特斯拉的全自动驾驶技术(Full Self-Driving, FSD)是其AI战略的核心,依托于自研的运算平台和巨大的算力支持,基于大规模行驶里程所积累的数据,不断优化其AI模型。特斯拉自 2013 年开始探索自动驾驶技术,并在 2019 年推出了搭载自研 FSD 芯片的全自动驾驶计算平台。自特斯拉FSD发布以来,已经实现了超过16亿公里的行驶里程。
- AI硬件研发:Tesla自主研发了完全自动驾驶(FSD)芯片,替代了以往依赖的NVIDIA硬件。该芯片经过专门设计,提升了自动驾驶计算能力和效率,是Tesla实现全自动驾驶愿景的重要基础。Tesla正在开发名为Dojo的超级计算机,专用于训练自动驾驶系统的深度学习算法。Dojo通过处理海量的视觉和传感器数据,优化AI模型训练的速度和性能,帮助Tesla更快实现FSD的商业化。
- 能源解决方案:Tesla还提供家用和商业用能源存储系统,如Powerwall、Powerpack和Megapack,帮助用户储存太阳能并优化能源使用。通过与太阳能产品集成,Tesla推动清洁能源解决方案的普及。
- Optimus:Optimus 定位为通用型双足自主仿人机器人,能够执行不安全、重复性或乏味的任务,以解决劳动力短缺的问题。特斯拉计划将 Optimus 部署于自家的超级工厂,以执行一些重复性的工作,如搬运材料、组装零件等。未来,特斯拉致力于推动 Optimus 走进千家万户,帮普通家庭完成家务劳动,如做饭、清洁等。
- 无人驾驶出租车(Robotaxi):2024年4月,马斯克宣布特斯拉计划在Q3正式发布无人驾驶出租车(Robotaxi),这将颠覆传统的出行方式,实现车辆的高效率共享使用。
商业模式:Tesla的商业模式涵盖了电动汽车、自动驾驶和能源解决方案的多个维度,依托硬件销售和软件订阅两种模式获利。
- 硬件销售:Tesla通过直接向消费者销售电动汽车(Model S、Model X、Model 3和Model Y)获利;Tesla通过销售Powerwall、Solar Roof等产品拓展了能源市场,推动可再生能源技术的应用。
- 软件与订阅服务:Tesla的完全自动驾驶(FSD)软件以一次性购买或订阅服务的方式销售,允许车主获取更高级的自动驾驶功能。这一模式为Tesla提供了额外的持续收入来源。
- 能源服务:Tesla通过Powerpack和Megapack提供企业级能源存储解决方案,并在全球范围内与公用事业公司合作,帮助优化电网运行,推动可再生能源的应用和储存。
Tesla是全球电动汽车市场的领导者,其高性能、长续航和创新的电动车产品使其在全球电动车销量中占据了重要份额,尤其是在美国、欧洲和中国市场。Tesla不仅是全球电动汽车市场的领导者,其在自动驾驶、能源解决方案和AI技术领域的创新也产生了深远影响。
4.3.4 Anthropic
Anthropic是一家成立于2021年的人工智能(AI)研究公司,致力于开发安全且可靠的大规模人工智能系统。该公司由OpenAI的前研究人员创建,目标是通过更具可控性和可解释性的人工智能模型推动AI的安全发展。Anthropic专注于AI伦理、AI安全性、透明性和公平性,在开发强大的AI模型的同时,致力于减少模型可能带来的社会风险。
业务领域:核心业务围绕人工智能系统的安全性、可解释性和伦理性展开,特别是大规模语言模型(LLM)和生成式AI。
- 大规模语言模型(LLM):Anthropic的Claude模型系列是其代表性的大型语言模型,类似于OpenAI的GPT模型。这些模型能够进行复杂的自然语言理解和生成,广泛应用于对话系统、自动化写作、问答系统等领域。
- Claude API:Anthropic提供基于其Claude模型的API服务,允许开发者和企业集成其AI模型进行自然语言处理任务。通过API,企业能够调用Claude模型进行自动化对话、内容生成和数据分析等功能。
- 安全的AI解决方案:Anthropic向企业提供定制化的AI解决方案,特别是在对安全性要求较高的领域,如金融、医疗、法律等,通过其安全优先的AI模型,帮助企业降低AI应用的风险。
商业模式:商业模式围绕AI模型的开发与安全应用,同时通过API服务和企业解决方案为商业客户提供AI技术支持。
- API服务:通过API平台,Anthropic将其大规模语言模型Claude向开发者和企业开放,按需提供自然语言处理和生成的AI功能。开发者和企业可以通过订阅模式按使用量付费,获取Claude模型的AI能力,并应用于对话系统、自动化工作流、内容生成等业务场景。
- 定制化AI解决方案:Anthropic为需要强大AI功能的企业提供定制化的AI解决方案,特别是在对安全性要求较高的行业。公司通过提供安全可靠的AI模型,帮助企业在应用AI时避免潜在的风险,并确保AI系统的透明性和可解释性。
- 安全与伦理咨询:由于Anthropic在AI安全和伦理领域的专长,公司还为企业和政府提供AI伦理与安全咨询服务,帮助其评估和改善现有AI系统的安全性,防止AI带来的潜在风险。
Anthropic的技术和研究已经在AI社区和行业中产生了重要影响,特别是在推动AI安全和伦理问题的讨论上。通过其Claude模型和安全优先的AI系统,Anthropic正在赢得更多企业的关注和应用。
4.3.5 Cohere
Cohere成立于2019年,总部位于加拿大,是一家专注于自然语言处理(NLP)技术的人工智能(AI)公司。Cohere致力于开发强大的语言模型,帮助企业将AI技术应用于文本理解、生成、翻译和其他自然语言处理任务。与OpenAI、Anthropic等公司不同,Cohere主要侧重于企业级的NLP解决方案,特别是通过提供灵活且可定制的AI模型,帮助企业有效地利用自然语言处理技术。
业务领域:核心业务围绕自然语言处理(NLP)和生成式AI展开,提供多种语言模型和开发工具,推动AI在企业中的应用。
- 自然语言处理(NLP):Cohere专注于开发大规模语言模型,这些模型能够理解和生成自然语言。它们被广泛应用于文本分类、情感分析、自动摘要、翻译等任务,适用于各种行业的文本处理需求。
- 生成式AI:Cohere的生成式AI技术能够生成高质量的自然语言文本,用于内容创作、自动化写作、摘要生成和数据报告等任务。通过AI生成的内容能够满足媒体、市场营销等行业对高效内容生成的需求。
- API与开发工具:Cohere提供API服务和灵活的开发工具,帮助企业和开发者快速集成AI技术。Cohere的工具包支持各种编程语言和框架,便于不同规模和技术水平的开发团队采用。
- 企业解决方案:Cohere不仅提供通用的语言模型,还能够根据企业的需求进行定制化开发,使模型更加贴合特定行业的业务场景。这些定制模型广泛应用于客户支持、电子商务、法律、金融等需要高精度语言理解的领域。
商业模式:商业模式围绕API服务、定制化解决方案和企业NLP咨询服务展开,主要面向企业客户提供高级NLP工具和支持。
- API服务:Cohere通过其API平台提供自然语言处理和生成服务,开发者和企业可以按需调用这些API进行文本处理任务。Cohere采用基于订阅和按使用量计费的商业模式,灵活满足不同规模企业的需求。
- 定制化NLP解决方案:Cohere为需要个性化语言处理能力的企业提供定制化的NLP解决方案,企业可以根据行业需求定制模型,并优化AI系统的表现。特别是在金融、法律、客户服务等对文本处理精度要求较高的行业,Cohere的定制化模型具有强大的市场竞争力。
- 企业咨询与技术支持:Cohere为企业提供深入的NLP咨询服务,帮助企业优化其AI和语言处理系统,确保企业能够最大化地利用NLP技术。Cohere还为企业和开发者提供培训,帮助他们了解如何更好地使用Cohere的API和语言模型,提升内部团队的AI能力。
Cohere在企业级自然语言处理市场中的表现引人注目,通过其高效的API服务和定制化解决方案,Cohere已经赢得了多家企业的信任,并在多个行业中广泛应用。Cohere的NLP技术已经应用于金融、法律、医疗、客户服务等领域,帮助企业通过AI技术实现自动化文本处理、数据分析和客户支持等任务,提升运营效率。
4.4 AI落地应用和APP(下游)
在AI产业链的下游,AI应用主要是针对具体行业或企业需求的AI解决方案。这一类应用的核心目标是将AI技术集成到行业工作流程中,推动行业智能化转型。AI下游应用涵盖的范围较广,既包括企业级解决方案,也可能涉及消费者市场。
4.4.1 OpenAI — ChatGPT
ChatGPT是OpenAI于2022年11月推出的基于大型语言模型的人工智能聊天机器人,能够进行自然语言处理和生成,提供多种智能化服务。推出仅两个月后,ChatGPT在2023年1月末的月活用户突破1亿,成为全球用户破亿所花时间最短的平台。
- 功能:ChatGPT使用生成式预训练模型(GPT)来理解和生成自然语言文本,支持多轮对话、回答问题、提供建议和生成内容等,应用场景涵盖客户支持、写作辅助、知识问答等领域。
- AI技术:自然语言处理(NLP)、生成式预训练模型、深度学习。
- 典型应用场景:智能客服、内容生成、教育支持、写作辅助。
4.4.2. Zebra Medical Vision — 医疗影像分析
Zebra Medical Vision是一家使用AI技术进行医学影像分析的公司,帮助医生诊断疾病如癌症、心脏病、肺炎等。
- 功能:Zebra Medical Vision的AI系统通过分析X光片、CT扫描、MRI等医学影像,自动识别潜在的病理变化,并提供诊断建议,帮助医生更快、更精准地识别疾病。
- AI技术:深度学习、计算机视觉、医学影像处理。
- 典型应用场景:癌症筛查、心脏病检测、肺部疾病诊断。
4.4.3. Zoom — 智能会议功能
Zoom是一款视频会议平台,广泛用于远程工作、在线教育和社交互动。其视频会议系统通过云计算和AI功能(如实时字幕、背景虚化)提供高质量的远程协作体验。
- 功能:Zoom利用AI功能提供实时字幕、背景虚化、噪音抑制等智能会议服务,改善远程协作体验。
- AI技术:自然语言处理(NLP)、机器学习、计算机视觉。
- 典型应用场景:远程会议、在线教育、实时字幕生成。
4.4.4. Lemonade — AI驱动的保险理赔
Lemonade是一家利用AI技术优化保险服务的公司。它通过AI和聊天机器人简化保险理赔流程,提供快速、个性化的保险服务。
- 功能:Lemonade的AI系统使用自然语言处理和机器学习技术自动处理保险理赔请求,快速分析客户需求并作出理赔决策。
- AI技术:自然语言处理(NLP)、机器学习、自动化决策系统。
- 典型应用场景:自动化保险理赔、风险评估、客户服务。
4.4.5. Alibaba — 智能零售
阿里巴巴的无人超市是利用人工智能(AI)、物联网(IoT)、大数据和生物识别技术打造的全自动化零售模式。无人超市的核心是通过技术手段实现“无人化”运营,消费者可以在不依赖传统店员的情况下完成购物流程。
- 功能:阿里巴巴的智能零售系统使用AI和RFID技术,实现自动结账、库存管理、个性化推荐等功能,消费者无需人工干预即可完成购物。
- AI技术:计算机视觉、物联网(IoT)、机器学习。
- 典型应用场景:无人超市、自动化结账、个性化商品推荐。
4.4.6. Apple Siri — 智能语音助手
Siri是苹果的智能语音助手,通过自然语言处理(NLP)技术,帮助用户完成各种任务,如设置提醒、导航、发信息等。
- 功能:苹果设备中的智能语音助手,能够帮助用户通过语音指令完成操作,包括发送消息、设置提醒、导航、查询信息等。
- AI技术:NLP、语音识别、机器学习。
- 典型应用场景:语音指令执行(打电话、发短信、设置提醒)、导航、信息查询。
4.4.7. Spotify — 音乐推荐系统
Spotify使用AI和机器学习算法来分析用户的听歌习惯,提供个性化的音乐推荐。通过用户行为数据,Spotify可以预测用户可能喜欢的歌曲和艺术家。
- 功能:Spotify的AI驱动音乐推荐系统分析用户的听歌习惯和偏好,提供个性化音乐推荐和每日推荐歌单。
- AI技术:协同过滤、深度学习、机器学习。
- 典型应用场景:个性化音乐推荐、生成每日音乐推荐清单、发现新音乐。
4.4.8. Grammarly — AI写作辅助工具
Grammarly是一款基于AI的写作辅助工具,通过自然语言处理技术帮助用户检测拼写、语法和写作风格错误,并提供改进建议。
- 功能:Grammarly通过分析用户的文本,提供语法、拼写和风格改进建议,帮助提升写作质量。
- AI技术:自然语言处理、机器学习、文本分析。
- 典型应用场景:文本校对、写作建议、语法和拼写检查。
4.4.9. Replika — AI聊天机器人
Replika是一个AI聊天机器人,用户可以与它进行个性化对话并建立情感联系。Replika利用NLP和情感分析技术,模拟人类对话,帮助用户缓解压力和进行自我反思。
- 功能:Replika的聊天机器人,用户可以通过与AI进行对话来建立情感联系。它模仿人类对话风格,提供情感支持,并能帮助用户自我反思。
- AI技术:NLP、深度学习、情感分析。
- 典型应用场景:情感陪伴、对话互动、自我反思。
4.4.10. Youper — 情感健康助手
Youper是一个AI驱动的情感健康应用,帮助用户通过情感日记和对话分析管理情绪和心理健康。AI分析用户的情感状态,并提供建议和冥想练习。
- 功能:帮助用户通过情感日记、对话分析和冥想技巧来管理情绪和心理健康。
- AI技术:NLP、情感分析、机器学习。
- 典型应用场景:情感日记、冥想引导、心理健康管理。
4.5 AI Agent
AI智能体(AI Agent)是指一种能够感知其环境并根据环境中的信息进行决策和行动的自主计算系统。智能体通常具备感知、推理、学习和行动能力,并能在某种目标或任务的驱动下与环境或其他智能体交互。AI智能体可以应用于从简单的规则系统到复杂的深度学习模型,广泛应用于自动化、机器人、游戏AI等领域。
我们平常看到的各类AI消费者应用程序,比如Apple手机的Siri助手、ChatGPT聊天机器人等,其实就是AI Agent。这些AI Agent直接面向普通消费者提供AI产品和服务,通过AI技术为用户提供便利、个性化的服务和娱乐体验。
目前市场上大部分面对C端的AI应用程序,本质上都属于AI Agent的形态之一,下图是Insight Partners绘制的AI Agent市场图谱,涵盖众多公司众多行业的各类Agents。
4.5.1 AI Agent技术架构
一个典型的AI Agent技术架构由数据层、iPaaS(集成服务平台层)、自动化层和用户界面层组成。这四层架构共同支撑AI Agent的感知、决策、行动和交互能力。每一层在系统中都发挥了独特的作用,并且相互协作,确保AI Agent能够有效地处理任务和与环境交互。
- 数据层:数据层是AI Agent技术架构的基础,负责收集、存储和管理各种类型的数据。这些数据来自不同的输入源,包括传感器、用户交互、历史记录以及外部系统。AI Agent依赖这些数据进行感知、分析和学习,以便做出有效的决策。
- iPaaS层:iPaaS(Integration Platform as a Service)是一种集成服务平台,负责将内部和外部的数据源、应用程序和服务连接在一起,确保系统的各个部分能够顺畅协作。通过iPaaS平台管理和调用外部API,确保AI Agent能够访问和利用外部服务(如第三方AI模型、外部数据服务)。iPaaS是AI Agent的“神经中枢”,它使不同系统能够互操作,确保数据、功能和服务的流畅连接。
- 自动化层:自动化层是AI Agent的核心,负责执行AI模型的推理、决策和任务的自动化执行。它是使AI Agent能够感知、决策和采取行动的主要机制。该层通过机器学习、深度学习和自动化流程的管理,实现智能化操作。
- 用户界面(UI层):用户界面层是AI Agent与用户进行交互的桥梁。它通过直观的图形界面或语音交互让用户能够与AI Agent进行通信、发出指令或获取反馈。良好的用户界面可以极大提升用户体验,使AI Agent的操作更加顺畅和高效。
一个典型的AI Agent的技术架构通过数据层收集和管理数据,iPaaS层确保各系统和服务的集成,自动化层执行AI模型的推理和任务的自动化处理,而用户界面层则负责与用户进行交互。四层结构紧密协作,使AI Agent能够感知环境、做出决策并执行任务,实现了智能化操作和人机交互的高效融合。
4.5.2 Top100 AI Agent消费者应用程序
A16Z根据每月网站独立访问量,给出了Top100 AI消费者应用程序,包括移动端和Web端产品。
经过分析可以发现,这些AI应用程序大多属于创意工具类(聊天机器人、通用助手、文生图、文生视频、照片/视频AI),榜单上 52% 的公司专注于内容生成或编辑,涉及多种形式 — — 图像、视频、音乐、语音等。在 12 家新进入者中,58% 属于创意工具领域。
这反映出当前AI Agent的实际情况,偏向于创意工具类的应用,整体的功能偏初级和早期应用,对于深入人们日常生活中成为不可或缺的国民级/杀手级应用,还有较大的差距,而随着AI技术和LLM的进一步发展,AI Agent将大有可为。
5. Web3与AI的结合
5.1 Web3和AI结合的优势
AI 本质上是一种先进生产力,其快速发展依赖于三个核心要素:数据、算法和算力。
而加密货币和区块链是一种生产关系,旨在通过去中心化的方式实现数据和资产价值的流转,赋予用户更多的数据和资产控制权和隐私保护。
区块链、Web3与AI的结合将进一步推动互联网和AI应用的发展。AI与区块链的结合为数据安全、隐私保护、智能合约执行和AI去中心化应用带来了新的机会。
- AI可以增强区块链系统的效率和安全性,更好的满足用户基于意图的需求,并通过链上数据的分析和处理,识别潜在的威胁和欺诈行为。
- Web3的发展为AI提供了一个全新的应用场景和价值体系。通过区块链技术,AI可以在去中心化网络中运行,确保数据的透明性、不可篡改性和用户隐私保护。
- 区块链技术可以为AI模型的数据处理提供透明、不可篡改的记录,确保数据的真实性和完整性,数据权的归属和使用。
- Web3 Token经济激励机制可以为AI模型和应用提供低成本的启动、生态建设和用户激励,帮助AI项目更好的发展壮大。
5.2 AI概念区块链项目市值和融资:
根据CoinMarketCap数据显示,目前AI板块已经收录324个与 Web3 相关项目,整体市场规模高达$25.64B。
典型的项目包括NEAR Protocol(NEAR)、Artificial Superintelligence Alliance(FET)、Bittensor(TAO)、Render(RENDER)、Theta Network(THETA)、Akash Network(AKT)、AIOZ Network(AIOZ)、Arkham(ARKM)、io.net(IO)、Aethir(ATH)、Delysium(AGI)、Numeraire(NMR)、Sleepless AI(AI)等,主要涉及AI公链和基础设施、AI算力、AI应用等方面。
在AI融资方面,根据RootData数据,从2022年1月到2024年9月,AI赛道(包括AI、云算力、AI代理、AIGC)的总融资金额为14.87亿美元。投资机构对AI + Web3赛道的前景较为看好。
5.3 Web3 + AI赛道产业图谱
根据Foresight News的数据显示,目前行业至少有 140 多个 Web3 + AI 概念项目,覆盖了基础设施、数据、预测市场、计算与算力、教育、DeFi & 跨链、安全、NFT & 游戏 & 元宇宙、搜索引擎、社交 & 创作者经济、AI 聊天机器人、DID & 消息传递、治理、医疗、交易机器人等诸多方向。其中,基础设施类项目多达 30 个,NFT & 游戏 & 元宇宙类项目有 26 个,数据、计算、AI 聊天机器人类项目也均在 10 个以上。
综合上面这些Web3 + AI赛道的项目,可以将其按照AI上下游产业链进行分类,主要为三大类型:
5.3.1 AI基础设施:
包括基础设施和算力,为AI应用提供基础服务和资源支持。
- 公链:通过AI+区块链底层基础设施,为其他应用提供基础设施服务(算力、存储、LLM调用部署等)和LLM调用与部署。Near、Olas、Cortex、Fetch.ai属于此类项目。
- Web3 + 算力资源网络:AI模型的实现需要强大的运算能力,传统Web2领域的算力主要集中在大厂或部分计算资源提供商手中,Web3通过边缘计算和分布式技术实现算力资源(个人显卡、CPU、存储等)的网络共建、算力激励和数据治理。Filecoin、Render Network、Io.net、Ather等都是此类项目。
5.3.2 Web3 + 数据/模型 + 市场/网络/协议:
AI的发展需要大量的数据和复杂的算法模型来训练智能系统。在传统的Web2领域,大型互联网公司(如Google、Facebook、Amazon)通常掌握着算法和数据的主导权。
而Web3带来了一个新的可能性,通过去中心化的激励机制和区块链技术,构建起一个去中心化的AI数据、模型和网络市场,打破了原有的资源垄断,让更多的参与者(中小企业和个体)有机会进入并贡献于AI生态中。
通过代币化激励机制,市场参与者能够共享和贡献资源,如算法模型、数据和计算能力。这将极大促进AI的开放性和协作性,降低AI发展的门槛,使中小企业和个体开发者也能参与AI产业,进而推动AI的快速发展。
去中心化的AI数据、模型和网络市场主要包括4种类型:
- 去中心化模型网络/市场:通过区块链和代币化激励机制,形成一个开放的算法模型市场。在这个市场中,开发者和研究人员可以贡献、优化和分享AI模型,用户可以通过网络选择和使用最适合的模型来解决特定问题。模型通过共识机制进行调度和筛选,优质模型可以获得奖励,低效模型则逐渐被淘汰。例如Bittensor是一个去中心化的AI模型市场,允许开发者通过贡献和优化AI模型来获得奖励。
- 去中心化数据交易市场:去中心化数据交易市场通过区块链技术让数据的拥有者(个人或企业)能够自由分享和交易数据。通过代币化和智能合约,数据提供者能够获得公平的经济回报,同时数据消费者可以获得高质量的数据用于AI模型的训练。该模式鼓励更多人贡献数据,推动AI应用的多样化和公平性。例如Ocean是一个去中心化数据市场,通过区块链和智能合约,让数据资产可以被标记化并交易。NEAR 官方发布的NEAR Tasks是一个基于区块链的人工智能标注平台。Measurable Data(MDT) 是一个去中心化数据交换经济系统,旨在提供基于区块链的数据经济,数据提供者和数据购买者可以安全和匿名地交易数据。
- 去中心化数据模型训练市场:在去中心化的数据模型训练市场中,开发者可以利用来自全球的分布式计算资源和数据进行模型训练。数据的提供和模型的训练都可以通过区块链上的智能合约进行协调和管理,确保透明度和公平性。同时,去中心化数据训练市场降低了进入AI领域的成本,让更多的中小企业和个人开发者可以参与其中。例如Fetch.AI是一个结合AI与区块链的去中心化平台,允许开发者在去中心化网络中通过自主智能体(AI Agent)进行数据分析和模型训练。Cortex是一个去中心化的AI平台,支持AI模型的分布式训练和推理。
- 代币化AI模型与AI Agent产品市场:通过代币化机制,AI模型和AI Agent可以作为数字资产进行交易和使用。这种代币化方式可以让开发者通过贡献AI模型、算法或智能体,获得经济回报,同时用户可以通过智能合约购买或租用这些AI服务。这种去中心化的市场使AI的使用变得更加灵活和开放,用户可以根据需求选择不同的AI服务,而开发者也能够从中获利。例如SingularityNET平台用户通过代币购买不同的AI服务,开发者可以通过平台发布自己的AI Agent或模型,并通过代币交易获得收益。
5.3.3 AI+应用层:
面向终端用户的Web3 + AI应用程序,主要是依托AI技术和资源,在链上数据、链游、社交、NFT、创作者经济、DeFi等方面构建AI+ Dapp应用项目,利用AI赋能智能合约决策执行,更好的满足用户基于意图的需求,并在交易、创作、隐私保护等方面提供全新体验。
- 链上AI数据分析:通过AI技术对区块链上的海量数据进行深度挖掘和分析,帮助用户了解市场动态、投资机会和潜在风险。AI可以在链上行为中发现模式、异常活动(如洗钱、黑客攻击),并为用户提供定制化的投资建议。Dune、Nanse、Chainalysis、Arkham(Arkm)是此类项目。
- AI Agent:构建Web3 AI Agent充当用户的智能助手,可以基于链上数据、用户需求以及市场变化,自动执行决策和任务。通过深度学习和强化学习,AI Agent可以理解用户意图并优化任务执行。例如Fetch.AI开发了自主AI Agent,能够自动执行链上任务,如数据交换、市场交易等。AI聊天机器人(Myshell、CharacterX)、AI搜索引擎(Kaito、Pulsr、QnA3、Typox AI)是此类项目。
- AI 交易Bot:AI交易Bot通过数据分析、机器学习和深度学习模型,能够识别市场趋势、执行套利策略、进行量化分析等,并且可以实现自动化的交易。AI交易Bot基于链上实时数据执行智能合约,进行自动化交易,减少人为错误并提高交易效率。目前TG Bot赛道产品属于此类的初级产品,Rockefeller Bot(Rocky,链上AI交易机器人)和3Commas(AI驱动的自动化交易平台)也属于此类。
- AI创作者平台:利用AI技术帮助创作者在区块链上进行内容创作、作品发行和分发,尤其是在NFT、虚拟艺术品和