kazoottt-blog/src/content/post/2024-W17.md

---
title: 2024-W17
date: 2024-04-26
author: KazooTTT
type: Post
status: Draft
tags: []
finished: true
published: true
category: 周报
slug: 2024-W17
description: >-
  在2024年4月22日至4月28日期间，人工智能领域有多项重要更新和发布。Myshell发布了OpenVoice2开源语音模型，能够通过少量音频样本复制说话人的声音并生成多种语言的语音，且完全开源。Snowflake推出了Arctic，一个面向企业的顶级语言模型，具有高效的企业任务性能。Adobe发布了Firefly
  Image
  3模型，用于文本到图像的生成。OpenAI为其API引入了更多企业级功能，包括增强的安全性和更好的行政控制。此外，GitHub上的多个项目如Speechless和Llama-3-8B-16K也进行了更新，增强了语言处理和推理能力。在应用方面，ComfyUI
  Workflows提供了工作流模板，Cloudflare推出了AI
  Playground，Perplexity提供了企业会员和企业定制服务。此外，还有多个教程和资料推荐，如Llama
  3的微调教程和大规模预训练语言模型的理论基础。这些更新和资源为AI领域的研究者和开发者提供了丰富的工具和知识。
rinId: 97
toAstro: true
---

日期范围：2024/04/22 - 2024/04/28

# 1. 模型动态

## Myshell 发布 OpenVoice2 开源语音模型

[GitHub - myshell-ai/OpenVoice: Instant voice cloning by MyShell.](https://github.com/myshell-ai/OpenVoice)

[Open Voice](https://research.myshell.ai/open-voice)

它只需参考说话人的一小段音频片段，就能复制其声音并生成多种语言的语音

亮点：

能精细控制语音风格，包括情感、口音等多种参数。

完全开源，允许免费商业使用

## [Snowflake Arctic - LLM for Enterprise AI](https://www.snowflake.com/blog/arctic-open-efficient-foundation-language-models-snowflake/?continueFlag=5e163579825fe6026ed04354f826d987) 面向企业的 LLM

![IMG-20241021113030266](https://pictures.kazoottt.top/2024/11/20241125-bff04a759aafa7c937157293879a80e5.png)

2024-04-24

本文介绍了 Snowflake Arctic，一个高效智能且真正开放的顶级企业级 LLM。

它具有出色的企业任务性能，如 SQL 生成、编码和指令遵循基准，同时使用的训练计算预算不到 200 万美元（不到 3K GPU 周）。

它还使用了三阶段数据课程，专注于通用技能和企业技能，以实现高效的训练和推理。目前 Arctic 可在 Hugging Face、NVIDIA API 和 Replicate 上获取，预计在未来几周上线到其他的模型平台。

## Firefly Image 3 Model - Adobe 最新版文生图模型

![IMG-20241021113030298](https://pictures.kazoottt.top/2024/11/20241125-81683bd45ee0bfc84efe267991588021.png)

体验地址：

[Adobe Firefly](https://firefly.adobe.com/)

![IMG-20241021113030351](https://pictures.kazoottt.top/2024/11/20241125-b4504ff2bc70c4873e1b53fafef3c6c0.png)

## [Introducing more enterprise-grade features for API customers](https://openai.com/blog/more-enterprise-grade-features-for-api-customers?continueFlag=5e163579825fe6026ed04354f826d987) 为 API 引入更多企业级功能

![IMG-20241021113030402](https://pictures.kazoottt.top/2024/11/20241125-303cb01d99dfa60ef73ba2ef55dcdacc.png)

OpenAI 发布了一篇博客来介绍对于 API 的与企业相关的功能升级内容。

亮点：

- 增强的企业级安全：引入 Private Link 和 native MFA，新增到现有企业安全特性中。
- 更好的行政控制：通过新的 Projects 功能，组织对单个项目有更精细的控制和监督。
- 助理 API 的改进：包括更准确的检索、实时对话响应支持等。
- 更多成本管理选择：如针对持续 TPM 使用的优惠和异步工作负载成本的降低。
- 持续的功能添加计划：专注于企业级安全、行政控制和成本管理。

## [GitHub - uukuguy/speechless](https://github.com/uukuguy/speechless)

![IMG-20241021113030448](https://pictures.kazoottt.top/2024/11/20241125-7dc1c4b00fa62370439d88016a2eef30.png)

Speechless AI，它是一个基于大型语言模型的人工智能助手，专注于将强大的语言处理和深度推理能力集成到实际业务应用中。

它通过增强模型的语言理解、知识积累和文本创作能力，引入长期记忆、外部工具集成和本地部署，旨在建立一个能够独立交互、持续进化并与各种业务场景紧密结合的智能协作伙伴。

此外，文本还提供了关于模型、工具、训练等方面的详细信息。

## [mattshumer/Llama-3-8B-16K · Hugging Face](https://huggingface.co/mattshumer/Llama-3-8B-16K?continueFlag=5e163579825fe6026ed04354f826d987) 上下文翻倍的 Llama-3-8B-16K

[X 上的 Matt Shumer：“I've doubled LLaMA 3's context window to 16K tokens. Fully open-source. Link in thread: https://t.co/uPgmrVojHX” / X](https://twitter.com/mattshumer_/status/1782576964118675565)

![IMG-20241021113030500](https://pictures.kazoottt.top/2024/11/20241125-2520b26c697fc447740dd3efaea5522e.png)

![IMG-20241021113030589](https://pictures.kazoottt.top/2024/11/20241125-d92299dab87a3af4abb7b5601c0e1108.png)

# 2. 优秀应用

## [ComfyUI Workflows - Developer Community](https://openart.ai/workflows/home)

工作流模板网站，主要是

![IMG-20241021113030616](https://pictures.kazoottt.top/2024/11/20241125-18060f3d70fca34e6c14fad24897401d.png)

## Cloudflare 推出 AI Playground

[Workers AI LLM Playground](https://playground.ai.cloudflare.com)

支持免费使用多种开源模型，并且支持在 playground 调试好之后生成对应的调用代码。

![IMG-20241021113030661](https://pictures.kazoottt.top/2024/11/20241125-01d140420c59fafd9f8f9881e087a661.png)

![IMG-20241021113030688](https://pictures.kazoottt.top/2024/11/20241125-a4c112eb9e36c4e1fb353647fc859d07.png)

与此同时 cf 还提供了其他的各种好用的工具，无论对于个人开发者还是企业都推荐使用。

[Workers AI · Cloudflare Workers AI docs](https://developers.cloudflare.com/workers-ai/)

## Perplexity 推出了企业会员和企业定制服务

![IMG-20241021113030737](https://pictures.kazoottt.top/2024/11/20241125-f281f619a96b59b2a67dbef48b7fc17a.png)

亮点：

Enterprise Pro 的强大功能：能为团队提供快速、最新且可靠的复杂问题答案，无需频繁点击链接、比较答案或在网上无休止搜索。

数据安全与隐私：确保只有合适的人能看到数据，不会有不必要的信息被分享，且数据不会被用于训练，同时保障数据隐私和安全。

安全管理与控制：通过实时通知可疑行为或危险活动来管理威胁和防止数据丢失，安全政策和控制符合最高行业标准。

用户管理：轻松添加、移除和管理团队成员。

单点登录：与身份提供商安全集成，用户可通过单点登录轻松登录。

Enterprise Pro 的效益：帮助企业加速研发，如 Databricks 估计每月能为团队节省 5000 个工作小时。

定价模式：针对不同规模的企业有不同的定价方式，小公司可通过自助流程获取，大公司则可根据购买的座位数量进行灵活定价。

常见问题：Enterprise Pro 是为提高生产力、发挥 Perplexity 全部功能并满足严格安全要求而设计的解决方案，能帮助人们快速获得可靠答案，还能用于询问内部数据问题。

## [Can You Run It? LLM version - a Hugging Face Space by Vokturz](https://huggingface.co/spaces/Vokturz/can-it-run-llm) 查看机器配置能否运行模型

选择模型和机器配置，可以查看这个配置能否运行对应的模型

![IMG-20241021113030790](https://pictures.kazoottt.top/2024/11/20241125-2412f7a7cb673cc10cc04221e16a7bb7.png)

## [GitHub - feiandxs/duckrush](https://github.com/feiandxs/duckrush) 搜索关键词并返回 LLM 便于处理的数据格式

一个简单快速的后端 API，基于 Hono，可以使用关键字在互联网上搜索相关内容，并将其转换为适合 LLM 处理的格式。支持在 Cloudflare 上部署。

![IMG-20241021113030827](https://pictures.kazoottt.top/2024/11/20241125-c5d009a8bbd978934383f4c3ec3aa999.png)

# 3. 推荐资料

## [Llama 3 Fine Tune with Custom Data - Mervin Praison](https://mer.vin/2024/04/llama-3-fine-tune-with-custom-data/)

LLama3 微调教程

[How to Fine Tune Llama 3 for Better Instruction Following? - YouTube](https://www.youtube.com/watch?v=WxQbWTRNTxY&ab_channel=MervinPraison)

![IMG-20241021113030852](https://pictures.kazoottt.top/2024/11/20241125-692aff615a32b1f8197c67978bd34d38.png)

## [GitHub - datawhalechina/so-large-lm: 大模型基础: 一文了解大模型基础知识](https://github.com/datawhalechina/so-large-lm)

[大模型理论基础](https://datawhalechina.github.io/so-large-lm/#/)

![IMG-20241021113030885](https://pictures.kazoottt.top/2024/11/20241125-f4fbb07b678beb0cfdec88f21d001576.png)

本项目是一个关于大规模预训练语言模型的教程，涵盖模型的各个方面，包括数据准备、模型构建、训练策略等，以及安全、隐私、环境和法律道德等方面的知识。项目以斯坦福大学课程为基础，结合开源贡献者的补充和更新，由项目团队成员分工撰写，预计三个月完成初始版本，后续根据社区贡献和反馈进行更新。旨在为相关领域的研究者和从业者提供知识和技术，拓宽受众的知识面，降低参与开源项目的门槛，并为大型语言模型研究领域贡献资源。

## [Getting Started With Mistral - DeepLearning.AI](https://www.deeplearning.ai/short-courses/getting-started-with-mistral/?continueFlag=5e163579825fe6026ed04354f826d987) Mistral 入门教程

课程主要的内容：

“You’ll learn about selecting the right model for your use case, and get hands-on with features like effective prompting techniques, function calling, JSON mode, and Retrieval Augmented Generation (RAG).”

“您将了解如何为您的用例选择正确的模型，并亲身体验有效提示技术、函数调用、JSON 模式和检索增强生成（RAG）等功能”

![IMG-20241021113030926](https://pictures.kazoottt.top/2024/11/20241125-b4291b88a3a143cdaa6d21f04eee1866.png)

## [Financial Market Applications of LLMs](https://thegradient.pub/financial-market-applications-of-llms/?continueFlag=5e163579825fe6026ed04354f826d987) LLM 在金融市场的应用

![IMG-20241021113030976](https://pictures.kazoottt.top/2024/11/20241125-34fd203215f29c312b89c8fecc893456.png)

重点：

📈 生成式人工智能与量化交易的相似性：生成式人工智能在自然语言处理中的应用，与量化交易策略在金融市场中的应用，有许多相似之处。

🤔 人工智能在金融市场中的应用挑战：金融市场数据的复杂性和噪声性，使得将人工智能应用于金融市场充满挑战。

👏 生成式人工智能在其他领域的应用前景：生成式人工智能在金融市场的应用面临挑战，但仍有可能在其他领域发挥作用，如辅助分析师进行基础分析等。

🤖 对人工智能在量化交易中应用的展望：尽管当前生成式人工智能在量化交易中的应用前景并不明

## [AI Agents With Low/No Code, Hallucinations Create Security Holes, and more](https://www.deeplearning.ai/the-batch/issue-245/)

这篇文本主要讨论了多代理协作、语言模型的安全漏洞、GPT Store 的管理问题以及利用 RAG 改进语言模型性能等方面的内容。

![IMG-20241021113031022](https://pictures.kazoottt.top/2024/11/20241125-50b3f6d9454d536afa08d8b0e1b8aeaf.png)

## [Notion – The all-in-one workspace for your notes, tasks, wikis, and databases.](https://airy-lunch-c6f.notion.site/Becoming-SMART-is-easy-using-science-85119819e23f423887265b3fc436d586?pvs=4)

本文介绍了基于科学的强大学习技巧。文中还对比了一些常见但低效的学习策略，如高亮和重读，并强调了自我测试、检索练习、间隔练习、交错学习和精细询问等有效方法的重要性。