
无论如何,2024 年是人工智能迄今为止最重要的一年——至少在技术商业化方面是如此。
2022 年底 ChatGPT 推出后掀起的大型语言模型 (LLM) 热潮丝毫没有放缓的迹象,不仅 OpenAI 和微软、Meta 和 Google 等科技巨头推出了许多新的 LLM,而且还有数十个其他初创企业和个人开发者。
事实证明,目前有关人工智能研究放缓的报道即使不是毫无根据,也是夸大其词。
此外,支撑大多数大规模法学硕士的 Transformer 架构之外的新技术也开始浮出水面,例如 Liquid AI 的 Liquid Foundation 模型。
最后,公司开始全面采用人工智能的“代理”方法——开发特定的人工智能驱动的机器人、应用程序和工作流程,这些机器人、应用程序和工作流程可以独立处理特定问题,或者比典型的法学硕士聊天机器人有更多的往返次数。更少的操作。
将今年的新闻报道提炼成前 14 名是一项令人烦恼的工作,更不用说前 10 名或前 4 名了。但我还是尝试了一下,尽管有些作弊,将几个故事组合成更大的主题。在我看来,以下是今年影响最大的:
1. OpenAI 扩展到 ChatGPT 之外
尽管来自新手和传统技术,甚至其自己的投资者和合作伙伴微软的竞争加剧,这家可以说是引领新一代人工智能时代最有责任的公司今年也没有错过任何机会。
o1 模型:OpenAI 发布了 GPT 系列之外的第一个新的大型通用模型系列,即 o1“推理”系列,它分配更多的时间来处理复杂的线索,从而提高准确性。它在科学、编码和推理任务中特别有效。
o3车型:自9月份起继续沿用o1车型,并于年底宣布推出更先进的o3车型。虽然这要到 2025 年初才会公开,甚至不会向任何第三方开放,但这表明 OpenAI 并没有满足于现状。
ChatGPT 搜索:最初是作为名为 SearchGPT 的仅限邀请的独立产品推出,后来合并到 ChatGPT 中,此功能可以在 ChatGPT 中实现更实时的网络信息检索和更精细的搜索结果呈现,从而增强其对最新查询的可见性。实用性,并与 Google、Bing 和新来者 Perplexity 正面交锋。
Canvas:Canvas于10月推出,将ChatGPT界面从对话界面扩展为类似工作站的窗格,可以根据用户请求动态更新内容,例如编辑文档或编码项目。当然,很难不将其视为对几个月前宣布的 Anthropic's Artifacts 的反应,或者至少是与之相当的功能。
Sora:在用其严密保护的视频生成模型逗弄了我们近一年之后,OpenAI 终于在 12 月初向大众推出了 Sora,并迅速引起了广泛的反应,因为它试图在竞争激烈的 AI 视频领域脱颖而出。 ,具有独特且经过深思熟虑的界面和故事板功能。
2. 开源人工智能起飞
Llama 3 和 3.1:Meta 在 4 月份推出了 Llama 3开yun体育app官网网页登录入口,为开源 AI 性能设立了新标准,然后在 7 月份迅速跟进推出了拥有 4050 亿个参数的 Llama 3.1。 Llama 3.1 版本用于为 Meta AI 提供支持,Meta AI 是该公司跨 WhatsApp、Messenger、Instagram 和 Facebook 等平台的集成助手,旨在成为使用最广泛的 AI 助手。
Llama 3.3:Llama 3.3 于 2024 年 12 月发布,其性能可与大型模型相媲美,但计算成本仅为其一小部分,使其更易于用于企业应用程序。
与此同时,阿里巴巴的 Qwen-2.5 系列和 DeepSeek 的新 V2.5 和 R1-Lite 预览版等中国型号似乎突然在一些基准排名中名列前茅,而英伟达本身并没有提供显卡和软件架构。此外,它还推出了自己的开源、功能强大的 Nemotron-70B 型号。
Nous Research 是一家位于旧金山的小公司,旨在以开源方式提供更加个性化、限制更少的人工智能模型,它有几个很酷的新想法。
我们不要忘记法国的 Mistral,它迅速扩展了自己的开源和专有人工智能产品。
3. Google Gemini系列成为最佳产品有力竞争者
在今年的卷土重来的故事之一中云开·全站体育app登录,谷歌的 Gemini 系列人工智能模型曾因其怪异的图像生成而受到嘲笑,并被批评过于“觉醒”,现在带着新的、更强大的版本回来了,这些版本现在已经在第三方性能基准测试中名列前茅。图表,它对开发商和企业的吸引力越来越大。
谷歌推出了 Gemini 2.0 Flash,这是一种多模态 AI 模型kaiyun.ccm,支持流视频分析,可以在屏幕上看到并指导你在做什么,紧随其后的是 Gemini 2.0 Flash Thinking,它与 OpenAI 的 o1 和 o3 推理模型竞争。
4. Agent AI席卷企业
随着时间的推移,“代理”人工智能从世界范围内的热门话题发展成为顶级企业软件供应商发布的一系列真正重要的产品和举措。例如:
Salesforce 的 Agentforce 2.0:Salesforce 几天前推出了 Agentforce 2.0,这是一款先进的 AI 代理,可增强其 CRM 和销售产品以及 Slack 的推理、集成和定制功能,从而显着提高企业生产力工具。
Joule by SAP:SAP 正在将其 Joule 聊天机器人转变为由开源大语言模型 (LLM) 提供支持的 AI 代理,以推动企业环境中的创新和效率。
谷歌的 Project Astra:作为 Gemini 2.0 计划的一部分,谷歌推出了 Project Astra,这是一款人工智能助手,旨在通过利用谷歌旨在提高用户生产力和决策能力的服务套件来提供实时上下文响应。
我对 2025 年的重大预测:人工智能生成的内容将占据主导地位
基于这些进步,预计到 2025 年,商业和消费领域人工智能生成的内容将激增,尤其是 OpenAI 到 Meta、谷歌、微软、苹果,甚至埃隆·马斯克的 xAI 等公司现在都将其内置于其产品中。
此次扩展将简化内容创建、增强个性化并提高所有领域的效率。
此外,我们预计大规模语言模型(LLM)和生成式人工智能驱动的机器人技术将在商业和消费者环境中得到初步大规模部署,从而彻底改变自动化和人机交互。
关注+星“Silicon LIFE”,每天获取人工智能及芯片领域的最新资讯。添加微信fusion9000加入“Silicon LIFE”粉丝交流群进行交流,实时滚动推送接收最新资讯

