---
title: 2024-W03-AI专题
slug: 2024-W03-ai-topics
published: true
category: 周报
description: >-
本期AI专题聚焦于2024年第三周的AI领域最新动态,包括Google推出的Circle to
Search功能,智谱AI发布的国产大模型GLM4及其GLMs商店,元象开源的XVERSE-Long-256K模型,以及OpenAI对GPT
Builders文档的完善。此外,还介绍了彭博推出的IB Connect服务,以及多个AI应用如WhisperSpeech和AutoGen
Studio。推荐阅读部分涵盖了AI创业案例、GPT-4的技术分析、Prompt工程指南等内容,为读者提供了丰富的AI知识和应用实例。
date: "2024-06-26T10:26:54.033Z"
rinId: 89
finished: true
tags:
- model
- text
- prompt
- RAG
- Q&A
- AIGC
- scene application
- report
- research
- study
- application scene
- scene
- application
toAstro: true
astroType: "post"
date_created: 2025-01-04T11:34:08+08:00
date_modified: 2025-02-07T11:16:10+08:00
---
[[2024-W03]]
# 2024-W03-AI 专题
## 模型动态
### [Google 推出 Circle to Search 划圈搜索](https://blog.google/products/search/google-circle-to-search-android/)
2024-01-17

介绍:Circle to Search 是一种通过简单手势在手机上搜索任何内容的新方式,无需切换应用程序。
Circle to Search 将于 1 月 31 日在部分高端 Android 智能手机(Pixel 8、Pixel 8 Pro 和全新三星 Galaxy S24 系列)上推出,支持所有语言和可用地区。
应用场景举例:
在社交平台上看到一张带有一些独特配料的美味玉米狗的图片,只需绕着玉米狗转一圈,问一个问题,比如“为什么这些如此受欢迎?您很快就会知道这些甜味和咸味的零食是韩国玉米狗,以及受欢迎的具体原因。
### [智谱AI发布国产最强大模型GLM4,理解评测与数学能力接近GPT-4,还有对标GPTs商店的GLMs商店与开发者分成计划](https://mp.weixin.qq.com/s?__biz=Mzg2MTIzNDcyNQ==&mid=2247485533&idx=1&sn=ed17d859d5ec67b13357ebe43de395c7&chksm=ce1b7b17f96cf201b1592ab73a0db6a596aa902cc9fc1f4b351d62224ed102654bf1d3eacaf4&mpshare=1&scene=1&srcid=0116V0BlzHfimamtoVj6d95h&sharer_shareinfo=7738639018d07fae5fd03f5387508b22&sharer_shareinfo_first=7738639018d07fae5fd03f5387508b22#rd)
2024-01-16

这篇文章详细介绍了智谱 AI 发布的国产大模型 GLM4 的能力,并且介绍了 GLMs 商店与开发者分成计划。
[GLM-3,GLM-4体验地址](https://chatglm.cn/main/detail)

GLMs 商店截图如下:

### [全球最长开源!元象开源大模型XVERSE-Long-256K,无条件免费商用!](https://mp.weixin.qq.com/s?__biz=Mzg3MDU3ODAwMw==&mid=2247495059&idx=1&sn=017a09e47bbe418bcaa09b2eb49e5256&chksm=ce890faff9fe86b9a3a2c5b869811e91cabbd7aa113f98874619c213276348294d442a622b3d&mpshare=1&scene=1&srcid=0116UnuW06Aj1Iz0CBEPPwyq&sharer_shareinfo=9d54a9350b83b80b8b62a31ed267fad6&sharer_shareinfo_first=9d54a9350b83b80b8b62a31ed267fad6#rd)
2024-01-16
元象发布全球首个上下文窗口长度 256K 的开源大模型 XVERSE-Long-256K,支持输入 25 万汉字,让大模型应用进入“长文本时代”。该模型全开源,无条件免费商用,且附带手把手训练教程,让海量中小企业、研究者和开发者更早一步实现“大模型自由”。

这篇公众号文章详细地介绍了元象所发布的模型,并且给出了一个简单的实践教程。
### OpenAI 完善了 GPT Builders 的文档
2024-01-13
[文档地址](https://platform.openai.com/docs/actions/introduction)

### 继 BloombergGPT 之后,彭博推出了 IB Connect 以改善数字化转型
2023-12-09
彭博自己所发布的新闻:[Bloomberg Welcomes Intra-Firm Chatbots to IB](https://www.bloomberg.com/company/press/bloomberg-welcomes-intra-firm-chatbots-to-ib/)
相关新闻报道:[After BloombergGPT, Bloomberg Launched IB Connect to Improve Digital Transformation](https://multiplatform.ai/after-bloomberggpt-bloomberg-launched-ib-connect-to-improve-digital-transformation/)
新闻报道中的总结如下:
- 彭博推出 IB Connect 服务,使用户能够将专有聊天机器人整合到 IB 聊天室中。
- 公司内部聊天机器人可从内部系统中提取关键信息,从而增强内部商业智能。
- IB Connect 促进了彭博终端与内部工作流程工具之间的无缝集成。
- 通过双向集成,客户可以利用自然语言处理功能将 IB 聊天室与其内部系统连接起来。
- 客户可以使用软件开发工具包定制聊天机器人,为其技术堆栈提供灵活性。
- 提供两种类型的聊天机器人:公司内部问答聊天机器人和公司内部通知聊天机器人。
- BloombergGPT 是早先介绍过的一种专门的金融语言模型,但它面临着一些限制,如只能使用英语和潜在的偏见。
## 优秀应用
### WhisperSpeech - 文本转语音
[官网地址](https://collabora.github.io/WhisperSpeech/)
[github地址](https://github.com/collabora/WhisperSpeech)

### AutoGen Studio
AutoGen Studio 是一个基于 autogen 的 web ui, 支持多个 agent、多模态。

构建流程构建
1. 配置技能:技能是描述如何解决任务的函数(如 Python 函数)。一般来说,一个好的技能有一个描述性的名称(如 generate_images)、大量的文档说明和良好的默认设置(如将文件写入磁盘以实现持久化和重复使用)。您可以通过提供的用户界面向 AutoGen Studio 添加新技能。在推理过程中,这些技能将在助理代理处理您的任务时提供给他们。
2. 配置 agent
3. 配置 agent 工作流:代理工作流程是一组代理的规格说明,这些 agents 可以共同完成一项任务。最简单的版本是设置两个 agents-- 一个 assistant agent,一个 user agent.
### [Moodboard Creator —— AI 生成情绪板](https://www.moodboardcreator.de/)

[推特地址](https://twitter.com/ftium4/status/1746419029961814098?s=12&t=UKmYswdLBh4dGuqwtKAXUA)
### [AI Gateway](https://github.com/Portkey-AI/gateway)

✅ 极速性能(速度是常规的 9.9 倍),同时只占极小存储空间(安装后约 45kb)
✅ 实现跨多个模型、服务提供商及密钥的负载均衡
✅ 具备故障回退功能,确保应用的高可用性
✅ 支持自动重试,并默认使用指数级延迟策略
✅ 可按需添加中间件
✅ 经过超过 1000 亿个 Token 的实战检验
## 推荐阅读
### [AI创业新典范:Monica.im如何用浏览器插件撬动商业价值?| 万字长文](https://mp.weixin.qq.com/s/tfQWfHaYq56PcWCPvGsoOA)
[monica应用链接](https://monica.im/)
Monica 是一个使用最先进的 AI 模型(GPT-4、Claude、Bard 等)帮助你对话、搜索、写作、翻译的一站式 AI 助手,并且提供多种图片、视频、PDF 处理的工具。

### [AI创业新典范:Monica.im如何用浏览器插件撬动商业价值?| 万字长文](https://mp.weixin.qq.com/s/tfQWfHaYq56PcWCPvGsoOA)
这篇公众号的文章详细地介绍了 Monica.im,主要内容如下:
1. 是什么以及用户对它的评价
2. 研究 Monica 的成功秘诀
3. Monica 的未来方向
可以阅读一下,从中学习参考该团队的经验。
### [GPT-4 Architecture, Infrastructure, Training Dataset, Costs, Vision, MoE](https://www.semianalysis.com/p/gpt-4-architecture-infrastructure)

本文对 OpenAI 的工程能能力做出了很高的评价,作者认为:“OpenAI 最持久的护城河是,他们的产品拥有最广的使用率、领先的工程人才,并且可以继续在未来的模型中领先于其他模型。”
然后对“模型架构、训练基础架构、推理基础架构、参数数量、训练数据集组成、标记数量、层数、并行策略、多模态视觉适应、不同工程折衷背后的思考过程、独特的实施技术,以及他们如何缓解与巨型模型推理相关的一些最大瓶颈。”等方面进行了详细的分析。
如果你想了解 GPT-4 的一些细节,可以阅读一下这篇文章。
### [ChatGPT Prompt Engineering](https://www.promptingguide.ai/models/chatgpt)
这个网站主要与提示词工程有关,它介绍了大模型相关的基础知识,并且根据各种维度(例如技术、应用、模型、风险与误用、大模型研究成果以及各种工具等)分别介绍了相关的技巧。
在近期的更新中,他们新增了针对不同模型的提示词技巧的教程。

与此同时,这也是一个开源的教程,如果感兴趣,也可以参与到这个项目中来。
[github地址](https://github.com/dair-ai/Prompt-Engineering-Guide)
### [fuxiang对于【devv.ai团队分享的RAG原理】的再整理](https://twitter.com/fuxiangPro/status/1747242297975062666)

[devv.ai团队分享的RAG原理原文](https://twitter.com/Tisoga/status/1731478506465636749)
### [dify的博客](https://dify.ai/blog)

博客的 Developer 栏目会介绍一 Dify 的技术实现,例如 [他们是如何提升RAG精确度的](https://dify.ai/blog/hybrid-search-rerank-rag-improvement)。

### [艾瑞咨询:2023年AIGC场景应用展望研究报告](https://waytoagi.feishu.cn/record/VQtLrDQWeehexvcTWxJcmSjMnPc)

该报告从技术角度、产业角度、经典企业案例、优秀 AI 场景应用四个方面对 2023 年的 AIGC 场景做出了总结。
### [Prompt技巧](https://weibo.com/1727858283/Naqzz5TOc#comment)

这篇微博汇总了 Prompt 的基础、进阶、高级技巧,并且推荐了几个 Prompt 开源项目。
- Prompt 提示工程指南:网页链接
- Prompt 编写模式:
- Awesome ChatGPT Prompts:
- Learn Prompt:
### 论文《表格链:推理链中不断演变的表格,促进对表格的理解》
Chain-of-Table: Evolving Tables in the Reasoning Chain for Table Understanding
[微博地址](https://weibo.com/1727858283/4988866724102248?wm=3333_2001&from=10DC293010&sourcetype=weixin&s_trans=7796753876_4988866724102248&s_channel=4)

[论文地址](https://arxiv.org/abs/2401.04398v1)
### [推荐阅读:文本分割的五个层次](https://weibo.com/1727858283/4989256960836646?wm=3333_2001&from=10DC293010&sourcetype=weixin&s_trans=2100889127_4989256960836646&s_channel=4)

[译文](https://baoyu.io/translations/rag/5-levels-of-text-splitting?continueFlag=61db114b5bb3eda119c3b0a42a3f0791)
[视频](https://www.youtube.com/watch?v=8OJC21T2SL4)
[Notebook](https://github.com/FullStackRetrieval-com/RetrievalTutorials/blob/main/5_Levels_Of_Text_Splitting.ipynb?continueFlag=61db114b5bb3eda119c3b0a42a3f0791)
### [温故而知新:大模型RAG问答研发的7个失分点及MOE专家组合模型的若干浅析](https://mp.weixin.qq.com/s/1p2VtmU-ClPQP1jEchGpGQ)