欢迎围观「AI晚报」栏目。AIGC前沿资讯,精选实用,睡前一阅,及时拿捏!

内容一览:

1、工信部:聚焦生成式AI等产业推进标准研究制定

2、实测字节跳动首个大模型产品“豆包”

3、金山办公发布 2023 半年报,WPS AI加速落地

4、百度李彦宏称年底将推出文心大模型4.0

5、昆仑万维发布“天工 AI 搜索”:国内首款融入大语言模型的 AI 搜索产品

6、GPT-3.5 Turbo 推出微调功能并更新 API

7、Meta 发布多语言转录和翻译模型 SeamlessM4T

8、AI 锂电池监测公司 Accure 获 720 万欧元的 A2 轮融资

9、AI复原兵马俑,带来穿越千年的凝视

10、AI“脑补”缅北电诈园区场景

11、《剪刀石头布》火爆全网,AI在动画领域狂飙

12、起猛了,被自己穿婚纱的样子惊艳到了

1、工信部:聚焦生成式AI等产业推进标准研究制定

8月22日,工信部等四部门联合印发了《新产业标准化领航工程实施方案(2023─2035年)》。

方案提出,聚焦新一代信息技术、新能源、民用航空等8大新兴产业,以及元宇宙、人形机器人、生成式人工智能等9大未来产业,统筹推进标准的研究、制定、实施和国际化。

2、实测字节跳动首个大模型产品“豆包”

在8月17日,字节跳动宣布开始对外测试AI对话产品“豆包”。在“豆包”发布前,字节被曝光的内部AI项目是“Grace”。进入豆包官网(https://www.doubao.com/)用户可直接通过手机号码、抖音账号或苹果ID即可注册登陆,还可以通过官网右上角提供的二维码下载App。

3、金山办公发布 2023 半年报,WPS AI加速落地

8 月 22 日晚间,金山办公正式公布了 2023 半年报数据。在报告期内,金山办公营收与净利润实现双增长,营业收入 21.72 亿元,同比增长 21.25%;归属于母公司所有者净利润 5.99 亿元,同比增长 15.32%;归属于母公司所有者扣除非经常性损益净利润 5.76 亿元,同比增长 39.88%,盈利能力持续提升。

报告期内,金山办公发布了基于大语言模型的智能办公助手 WPS AI,并定位为大语言模型应用方,锚定 AIGC(内容创作)、Copilot(智慧助手)、Insight(知识洞察)三个战略方向发展。

4、百度李彦宏称年底将推出文心大模型4.0

今年上半年,百度文心大模型更新至3.5版本,李彦宏称,年底将推出文心大模型4.0版本。

5、昆仑万维发布“天工 AI 搜索”:国内首款融入大语言模型的 AI 搜索产品

8 月 23 日消息,昆仑万维宣布,正式推出国内第一款融入大语言模型的搜索引擎 —— 天工 AI 搜索,并开启内测申请。

据昆仑万维官方介绍,传统搜索引擎基于关键词匹配,即根据用户输入的关键词识别检索范围,并匹配可能符合用户意图的海量信息。而基于大模型能力的 AI 搜索是一种生成式搜索,用户可通过自然语言清晰表达自己的意图,并获得有效组织和提炼后的答案。

天工 AI 搜索在所有回答中加入了信源索引,以此提高答案可靠性。同时,用户可将每轮次的搜索结果留存在天工内,便于随时查阅回溯,也可一键分享给他人。

此外,天工 AI 搜索还即将具备图像、语音等多模态搜索能力,更大程度地释放生产力、提升用户效率。

6、GPT-3.5 Turbo 推出微调功能并更新 API

OpenAI 在官网宣布,推出 GPT-3.5 Turbo 微调功能并更新 API,使企业、开发人员可以使用自己的数据,结合业务用例构建专属 ChatGPT。

价格问题是开发者们普遍关注的问题之一。根据 OpenAI 说法,微调成本分为两个部分:初始训练成本与使用成本:

  • 训练:0.008 美元 /1K tokens
  • 使用输入:0.012 美元 /1K tokens
  • 使用输出:0.016 美元 /1K tokens

例如,一个 gpt-3.5-turbo 微调作业中包含 10 万个 token 的训练文件。经过 3 个 epoch 训练轮次,预计成本为 2.40 美元。

此前,OpenAI 宣布各初版 GPT-3 基础模型(ada、babbage、curie 和 davinci)将于 2024 年 1 月 4 日正式关闭。OpenAI 如今发布了 babbage-002 和 davinci-002 作为这些模型的替代方案,用户可将其用作基础模型或微调模型。这些模型可以使用新 API 端点 /v1/fine_tuning/jobs 进行微调。下面是各基础 / 微调 GPT-3 模型的定价:

对此,有网友算了一笔账:微调的 GPT 3.5 Turbo 生成成本是基本模型生成成本的 8 倍,因此用户确实必须处于 OpenAI 提到的“将提示大小减少 90%”的范围内,才能从中获得成本效益。

微调定价,每 16 次用户交互的成本将超过 1 美元:16 次交互*(0.012 美元 * 4 输入 + 0.016 美元输出)= 1.02 美元。

7、Meta 发布多语言转录和翻译模型 SeamlessM4T

Meta 发布了一种新的语音转文本模型,称为 SeamlessM4T。该公司表示可以翻译近 100 种语言的语音到文本和文本到文本,对于语音转语音和文本转语音操作,它可以识别 100 种输入语言并将其转换为 35 种输出语言。

8、AI 锂电池监测公司 Accure 获 720 万欧元的 A2 轮融资

初创公司 Accure 宣布,已在 A2 轮融资中筹集了 720 万欧元,该笔融资由 BlueBear Capital 和汇丰资产管理领投、Riverstone Holdings 和 Capnamic Ventures参投。

其团队基于特定化学和结构的物理特性建立模型,然后以人工智能技术帮助监控电池状态、降低电池的火灾风险。

9、AI复原兵马俑,带来穿越千年的凝视

8月14日,抖音博主“趣说文物”发布了一条视频“秦代兵马俑的修复原貌”,对YouTube博主Panagiotis Constantinou的AI修复视频进行了剪辑。

视频中,秦代兵马俑借助AI重新获得了生命力,做出了细微的动态表情。

泥塑的真人古迹,竟然变成了有血有肉的精神小伙儿,穿越千年来和我们对话。不少网友对此戏称“秦始皇:全球手办第一人”,还有网友询问:“不懂就问,为什么这些都是单眼皮?”

10、AI“脑补”缅北电诈园区场景

有网友结合实时热点,利用AI绘图工具,还原了“缅北诈骗KK园区”的宿舍、洗漱区、禁闭室等场景。

8月19日,小红书博主“老魔仙的时光机”发布了一条题为“缅北诈骗园区宿舍一览,能存活多久逃出来”的笔记,展示了用AI生成的缅北诈骗园区场景——狭小逼仄的过道、紧锁的门窗和破烂不堪的床铺,形象还原了新闻事件中描述的缅北景象。

不少网友认为,“真实的环境肯定比这恶劣多了”,也有网友质疑“这就是AI能想到的最艰苦的条件了吗”,这条笔记成功引发了网友们对于缅北诈骗园区的讨论和分析。

11、《剪刀石头布》火爆全网,AI在动画领域狂飙

8月14日,B站UP主“wuhu动画人空间”转载发布了一条AI动画片《剪刀石头布》第二集,影片讲述了双胞胎兄弟通过“剪刀石头布”的形式争夺王位继承权的故事。该动画片由国外特效视频工作室Corridor Digital制作,首发于YouTube。

截至目前,“wuhu动画人空间”的转载视频播放量达到了55.7万次,获4.2万点赞,《剪刀石头布2》在YouTube平台上播放量也突破了56万次。

该视频引发关注的原因除了其沙雕无厘头的动画情节,更重要的这是一个由AI工具Stable Diffusion制作生成的动画。

12、起猛了,被自己穿婚纱的样子惊艳到了

如果说什么样的AI技术对普通人影响最大,那么一定非“AI特效玩法”莫属。临近七夕节,抖音平台上新了AI婚纱照这一特效滤镜。

用户只需上传自己的照片即可生成自己穿婚纱的写真,生成的照片大多浪漫唯美、氛围感十足,满足了大多数女生对于婚纱照的想象。

比如抖音博主“盛以婕”发布的这条视频“被自己穿婚纱的样子惊艳到了”,用AI滤镜一键模拟了自己的婚纱照。截至目前,这条视频已在抖音获20.3万赞,成为了账号近期的一个爆款作品。

Ai多一点,来自公众号:《AiPrompting》