在过去几年里,AI技术经历了飞速的发展,极大地推动了行业的创新和进步。
这些技术在许多领域都已经取得了显著的成果,从语言翻译到自动驾驶汽车,再到金融预测和医疗诊断,AI正在改变人们的生活方式和商业模式。
然而从去年年底开始,生成式AI开始狂飙,正以“天”为单位迭代,在这个快速发展的行业中,ChatGPT、多模态、大模型等AI技术不断涌现,AIGC已成为科技巨头们逐鹿的新战场。
作为一种高度技术化的产业,越来越多的公司认识到AI技术的重要性,并开始积极探索和应用这些技术,各家公司纷纷投入大量的资金和资源,以争夺AI技术的领先地位。
这些公司包括了知名的互联网巨头,也不乏传统行业的领军企业。他们通过AIGC平台向市场展示了自己的最新AI产品和技术成果,吸引了众多关注者的眼球。
通过利用AI技术,这些公司得以更好地理解客户需求、提高产品质量、优化市场营销和服务流程等。未来,AIGC行业将继续保持高速增长,推动产业结构的深刻变革。
那么,在接下来的内容中,我们将分别介绍这些科技巨头以及他们近期推出的AI项目,并探讨它们对于AI领域的创新和发展所带来的深远影响。
◉ OpenAI
OpenAI推出GPT-4后的一周后再度放出重磅消息。3月23日,OpenAI宣布在ChatGPT中实现了对插件的初始支持,帮助ChatGPT访问最新信息、运行计算或使用第三方服务。
这一升级极大地扩展了聊天机器人的功能,并首次允许它访问来自网络的实时数据。而此前ChatGPT一直受到限制,因为它只能从2021年结束的训练数据中提取信息。
OpenAI表示,插件不仅能让机器人浏览网页,还能与特定网站互动,有可能将该系统转变为各种服务和网站的广泛接口。在一份公告中,该公司表示,这几乎就像让其他服务成为ChatGPT的“眼睛和耳朵”。
此外,OpenAI还开源了知识库检索插件的代码,由任何开发人员自行托管,提供他们希望增强ChatGPT的信息。
最初,只有11个插件可用,这些插件包括允许用户查看现场体育赛事的比分、预订国际航班和购买外卖食品等。该公司补充说,它正在“逐步推出插件”,以便评估其在现实世界中的使用情况。
简单来说就是,ChatGPT终于“联网”了,也可以通过第三方插件,在衣食住以及工作、学习等方方面面更好地为用户提供服务。
需要注意的是,现在仍是Alpha阶段,OpenAI将从候补列表中将插件逐步开放,最初将优先考虑少数开发人员和ChatGPT Plus用户。
作为浏览插件可以完成的一个例子,该公司展示了有人询问今年奥斯卡获奖者的票房与最近上映的电影相比如何,该机器人在给出答案之前展示了它所查看的来源,这是ChatGPT以前无法做到的。
◉ Adobe
Adobe于3月21日发布了一款名为Firefly的AI工具,用户可以通过输入命令来快速修改图像。
Firefly工具的第一个AI模型将专注于图像和文本效果的创建。例如,Adobe的一个示例视频包括一个“生成变化”选项的产品演示,在演示视频中,Adobe Firefly能够使用AI通过突出显示多层艺术图像中的元素,生成不同版本的艺术作品。
在另一个例子中,Adobe展示了如何拍摄一张夏季场景的照片,然后输入“将场景更改为冬季”来更改图像,而无需用户进行任何编辑。
Firefly还可以自动更改用户正在处理的照片或图像,通过使用生成式AI在图像中已有内容的基础上创建画笔。
Adobe的新产品出现在Adobe和更广泛的AI的一个关键拐点。去年9月,该公司斥资200亿美元收购了设计工具Figma,并表示将把其他产品的功能整合到Figma中。Adobe表示,Firefly将首先以内测版本发布。
自OpenAI的ChatGPT爆炸性亮相以来,AI投资已经加速。与此同时,新的AI工具一直在与伦理问题作斗争。对于ChatGPT和类似的产品,这些问题处理的是模型倾向于“产生幻觉”看似合理但不准确的信息。
对于DALL-E或Stable Diffusion等成像技术,人们担心模型会窃取艺术家的内容,重新生成,并在未经创作者授权或许可的情况下呈现。Adobe表示,Firefly将把重点放在让创作者“有机会从你的技能和创造力中受益,并保护你的作品”。
◉ 英伟达
3月21日,英伟达举行了2023年度GTC开发者大会。
“切勿错过AI的决定性时刻!”这是此次大会的广告语。CEO黄仁勋发表了GTC 2023主题演讲,阐述该公司在人工智能上的诸多成就和最新进展,与此同时,也带来了多款重磅硬件新品,掀起了AIGC的高潮。
其中一款名为DGX Cloud是英伟达与微软 Azure、谷歌GCP和甲骨文OCI合作产生的一项人工智能超级计算服务。
这项服务让客户通过月租3万多美元就能即时访问全球规模的AI超级计算,快速轻松地扩展大型多节点训练工作负载,而无需等待大需求量的加速计算资源。
另外,NVIDIA CuLitho作为一项聚焦先进芯片设计制造的技术,它使用英伟达芯片,通过计算技术大幅优化芯片制造流程,加快半导体的设计和研制。
同时,大型数据中心将24小时全天候运行,以便创建用于光刻系统的掩膜板。利用GPU技术实现计算光刻,能够让传统光刻技术提速40倍以上,为2nm及更先进芯片的生产提供强大的助力。
此外,作为全球首个GPU加速的量子计算系统,NVIDIA DGX Quantum同样值得期待,该产品结合了通用量子控制系统Quantum Machines OPX+和NVIDIA Grace Hopper超级芯片。
它可以实现GPU和量子处理单元(QPU)之间的亚微秒级延迟,为高性能和低延迟量子经典计算的研究人员提供一种革命性的新架构,从而实现校准、控制、量子纠错和混合算法。
英伟达还推出全新GPU推理平台,四种不同配置针对不同工作进行优化。其中分别包括:用于加速AI视频的L4 Tensor Core GPU、用于优化图像生成的L40 GPU、用于促进大型语言模型部署的H100 NVL GPU、用于提升推荐系统和大型语言模型的Grace Hooper芯片。
这些新的平台推理性能相较之前而言,速度至少可提升10倍,最多可提升120倍,其能力将超乎人们想象。
◉ 微软
3月28日,GitHub宣布基于GPT-4的新一代代码生成工具Copilot X来了。
根据GitHub的数据,截至上个月,Copilot X已参与到微软全体云代码仓库中的46%,帮助开发人员将编程速度提高了55%。托马斯·多姆克表示:有了GPT-4加持的Copilot X,将让AI能力存在于代码生命周期的每一步,从根本上影响开发人员的体验。
新一代Copilot X可提供新的功能来增强编程工作中的体验。接入GPT-4之后,Copilot X拥有的语音功能,可以让用户进行语音交互。你只需说一句“Hey,GitHub”就能直接与强大的Copilot机器人对话,来解决工作中遇到的特定的编码问题,实现速度和质量的双重提升。
Copilot for Pull Requests这个功能可以让AI协助程序员拉取请求,如果完成一段代码修改要提交到分支上去的时候,它会自动读取改动内容,生成描述,并且还可以自动进行扩展补写。
Copilot for Docs这个功能提供智能文档编写工具,当在学习一个新的框架或者编程语言,却不知道怎么使用某个函数或API时,自己不用再去进行文档查阅了,AI就能自动提供查询帮助,做到一键搞定。除此之外,它还能够帮你快速定位文档,并找到你想要的内容,形成一篇优秀的技术文档。
Copilot for CLI这个功能提供终端/命令工具,无论简单的还是复杂的命令,只需打出开头,它就能给出联想,协助你完成程序编写。如果写的不准确,还可以进行修改,直到正确为止。
◉ 谷歌
在一众科技巨头陷入AI“内卷”漩涡的时候,作为一个有着横跨诸多领域产品线的谷歌也不甘示弱,继将生成式AI装进其Workspace“全家桶”(包括谷歌文档、Gmail、Sheets、Slides等)之后,又发布生成式AI Bard并推出Beta测试版,逐步分批向注册的公众开放测试。
Bard是由谷歌大型语言模型驱动的一个轻量化和优化版本的LaMDA,旨在协助用户创作、给用户提供信息和提出建议,基于文本、代码数据集和来自Web的真实世界信息,来生成既有信息性又有吸引力的内容。
Google表示:“Bard是您的创意和乐于助人的合作伙伴”,巨大的信息资源是它的最大优势,依托谷歌的搜索工具获取最新的信息,根据梳理就能给出对应的答案。
在使用Bard之前,用户需要签署一份服务条款协议。协议强调它只是一个实验,可能会给出不真实且危险的错误信息,并给出提醒可能会做出冒犯性的反应。
在使用过程中,可以给用户提供信息并完成日常工作。在回答时,一次性可以创建几个不同的版本,供用户从中择优选用。点击Bard回复下方的一个“Google it”按钮,就会打开一个新选项卡进行搜索,并能对信息的真伪进行核实。
虽然不少用户吐槽Bard的使用体验,但是由于Bard目前还处于测试阶段,有不完美的体验貌似也情有可原,它未来的开发及潜力如何,也许还需要时间的验证。
◉ 百度
当以ChatGPT为首的AI科技横扫中国的舆论场时,国人翘首以盼我们能开发出与之较量的同类产品,百度被视为国内比较有望追赶ChatGPT的大厂选手之一。
在万众瞩目中,3月16日下午,百度召开文心一言“邀请测试会”,文心一言是基于文心大模型推出的生成式对话产品。
顶着GPT-4带来的巨大压力,CEO李彦宏在会上展示了文新一言在文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成五大方面的能力。
也许是吸取了谷歌演示Bard“翻车”导致市值蒸发1000亿美金的教训,百度文心一言并没有采用产品现场演示,而是用提前准备好的问题和答案,这自然要引发众多吐糟。
作为国内第一款对标ChatGPT的产品,文心一言的现场表现并不算完美,在发布过程中,百度股价就一度下跌10%,网友晒出的“车水马龙”“夫妻肺片”等图片似乎也开启了群嘲模式。
对于文心一言的性能,李彦宏也坦言其并不完美,这类语言大模型的门槛非常高,而百度在过去十几年间一直在AI研发上持续投入,文心大模型的第一个版本在2019年就发了,此后每一年都要发布新的版本。
作为第一个发布大模型的全球大厂,百度文心一言的发布会似乎更具有“坐上牌桌”的意义,相较于一款完美的产品,让中国的玩家先坐上牌桌参与这个游戏,在当下时间节点上似乎显得更加重要。
◉ 创新工场
在紧锣密鼓、按“天”迭代更新的浪潮中,AI2.0汹涌而至。
创新工场董事长兼CEO李开复博士在3月14日的“AI 1.0 到 AI 2.0 的新机遇”趋势分享会上发表观点:“AI 2.0 带来的平台型机会将比移动互联网大十倍,这也是中国第一次迎来平台竞逐的机会。新平台上所有用户入口和界面都将被重写,能够建立下一代平台的公司将会取得巨大的优势和话语权。”
简而言之,AI2.0是一场绝对不能错过的革命。
如果将AI1.0时代理解为以深度学习为基础的人工智能大爆发,2.0时代就是以基础大模型为突破。我们可以将AI 1.0比喻成电,那么AI 2.0就是电网,从技术到平台,“这是AI迄今为止最重要的一个时代”。
3月19日,李开复宣布亲自筹组Project AI 2.0,一个致力于打造AI 2.0全新平台和AI-first生产力应用的全球化公司,并号召世界级人才一起打造这家世界级的未来公司。
在李开复的规划中,“Project AI 2.0不仅仅要做中文版ChatGPT。AI 2.0 不仅仅是个高能聊天工具,也不仅仅是图文创作的AIGC生成,Co-pilot 和如今看到的应用都还只是 AI 2.0 能力的开端。Project AI 2.0 是创新工场塔尖孵化的第7家公司,同时我们也积极寻找AI 2.0技术和应用相关的投资机会,加速打造 AI 2.0 的全新创业生态。”
我们今天所能看到的AI应用都只是AI 2.0的开端,包括ChatGPT以及其他各种AIGC程序。
我们可以尽情展望,在不远的未来,所有的应用都会被重写一遍,生产力应用即将进入井喷期,包括电商、娱乐、金融、医疗等行业,AI 将从“辅助”人到逐步“替代”人工,所有使用者界面将被重新设计改写。
正如李开复所言,对于AI 2.0 的未来,我们应当具有更多、更广阔的想象。
AI应用和大模型火爆全球,被视为开启了新的科技工业革命和AGI(通用人工智能)的新起点,科技巨头间追逐竞争,无数创业公司也争先恐后,资本和科技大拿的纷纷下场,在短短的数月之间,AI给世人带来了前所未有的震撼,并且,它还在持续迭代。
OpenAI在成立之初,就立下做AGI(通用人工智能)的flag,正如创始人奥特曼所言:“也许AGI是永远抵达不了的乌托邦,但这个过程会让人类越来越强大。”我们在这场科技竞赛中看到了星辰大海,如何在其中把握机会又如何面对AI所带来的挑战,是企业和个人都必须优先考虑的问题。
在2023年中国发展高层论坛上,360创始人周鸿祎表示,中国大语言模型技术水平和GPT-4的技术差距在2到3年之间,目前GPT的技术方向已经明确,不存在难以逾越的技术障碍,中国企业应当坚持长期主义精神,迎头赶上。
在过去几年,科技自强意识已经成为全民共识,在这场涵盖硬件基础设施、算力、算法、数据层和应用层多个维度的人工智能竞争中,强投入和硬实力都缺一不可。从“人有我有”到“人有我优”,在时间刻度不断缩短、速度与质量并行的赛道上,我们期待未来能交出更优秀的答卷。
就在今天,AI圈又爆出了一条劲爆消息:千位大佬联名呼吁暂停训练比GPT-4更强大的AI系统,暂停期至少6个月,公开信表示高级人工智能对社会和人类会构成深远的风险。
“AI可能会消灭人类”的警示是否是危言耸听我们不做判断,但众多研究和事实表明,对AI的监管和审查势在必行,AI带给我们挑战可能远远不止伦理和法律等层面,我们在享受AI带来的繁荣之时,也应大幅加快开发与之匹配的管理系统。
硅谷顶级投资人对AI有过这样一个预测:“这个市场的潜在规模难以把握 ——它将介于所有软件和所有人类的努力之间。”这份努力应在推动AI造福人类社会的同时,规避其所带来的灾难。
免责声明:本文不代表米塔之家立场,且不构成投资建议,请谨慎对待。