Files
kazoottt-blog/src/content/post/2024-W17.md
2025-01-07 15:27:11 +00:00

202 lines
12 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

---
title: 2024-W17
date: 2024-04-26
author: KazooTTT
type: Post
status: Draft
tags: []
finished: true
published: true
category: 周报
slug: 2024-W17
description: >-
在2024年4月22日至4月28日期间人工智能领域有多项重要更新和发布。Myshell发布了OpenVoice2开源语音模型能够通过少量音频样本复制说话人的声音并生成多种语言的语音且完全开源。Snowflake推出了Arctic一个面向企业的顶级语言模型具有高效的企业任务性能。Adobe发布了Firefly
Image
3模型用于文本到图像的生成。OpenAI为其API引入了更多企业级功能包括增强的安全性和更好的行政控制。此外GitHub上的多个项目如Speechless和Llama-3-8B-16K也进行了更新增强了语言处理和推理能力。在应用方面ComfyUI
Workflows提供了工作流模板Cloudflare推出了AI
PlaygroundPerplexity提供了企业会员和企业定制服务。此外还有多个教程和资料推荐如Llama
3的微调教程和大规模预训练语言模型的理论基础。这些更新和资源为AI领域的研究者和开发者提供了丰富的工具和知识。
rinId: 97
toAstro: true
---
日期范围2024/04/22 - 2024/04/28
# 1. 模型动态
## Myshell 发布 OpenVoice2 开源语音模型
[GitHub - myshell-ai/OpenVoice: Instant voice cloning by MyShell.](https://github.com/myshell-ai/OpenVoice)
[Open Voice](https://research.myshell.ai/open-voice)
它只需参考说话人的一小段音频片段,就能复制其声音并生成多种语言的语音
亮点:
能精细控制语音风格,包括情感、口音等多种参数。
完全开源,允许免费商业使用
## [Snowflake Arctic - LLM for Enterprise AI](https://www.snowflake.com/blog/arctic-open-efficient-foundation-language-models-snowflake/?continueFlag=5e163579825fe6026ed04354f826d987) 面向企业的 LLM
![IMG-20241021113030266](https://pictures.kazoottt.top/2024/11/20241125-bff04a759aafa7c937157293879a80e5.png)
2024-04-24
本文介绍了 Snowflake Arctic一个高效智能且真正开放的顶级企业级 LLM。
它具有出色的企业任务性能,如 SQL 生成、编码和指令遵循基准,同时使用的训练计算预算不到 200 万美元(不到 3K GPU 周)。
它还使用了三阶段数据课程,专注于通用技能和企业技能,以实现高效的训练和推理。目前 Arctic 可在 Hugging Face、NVIDIA API 和 Replicate 上获取,预计在未来几周上线到其他的模型平台。
## Firefly Image 3 Model - Adobe 最新版文生图模型
![IMG-20241021113030298](https://pictures.kazoottt.top/2024/11/20241125-81683bd45ee0bfc84efe267991588021.png)
体验地址:
[Adobe Firefly](https://firefly.adobe.com/)
![IMG-20241021113030351](https://pictures.kazoottt.top/2024/11/20241125-b4504ff2bc70c4873e1b53fafef3c6c0.png)
## [Introducing more enterprise-grade features for API customers](https://openai.com/blog/more-enterprise-grade-features-for-api-customers?continueFlag=5e163579825fe6026ed04354f826d987) 为 API 引入更多企业级功能
![IMG-20241021113030402](https://pictures.kazoottt.top/2024/11/20241125-303cb01d99dfa60ef73ba2ef55dcdacc.png)
OpenAI 发布了一篇博客来介绍对于 API 的与企业相关的功能升级内容。
亮点:
- 增强的企业级安全:引入 Private Link 和 native MFA新增到现有企业安全特性中。
- 更好的行政控制:通过新的 Projects 功能,组织对单个项目有更精细的控制和监督。
- 助理 API 的改进:包括更准确的检索、实时对话响应支持等。
- 更多成本管理选择:如针对持续 TPM 使用的优惠和异步工作负载成本的降低。
- 持续的功能添加计划:专注于企业级安全、行政控制和成本管理。
## [GitHub - uukuguy/speechless](https://github.com/uukuguy/speechless)
![IMG-20241021113030448](https://pictures.kazoottt.top/2024/11/20241125-7dc1c4b00fa62370439d88016a2eef30.png)
Speechless AI它是一个基于大型语言模型的人工智能助手专注于将强大的语言处理和深度推理能力集成到实际业务应用中。
它通过增强模型的语言理解、知识积累和文本创作能力,引入长期记忆、外部工具集成和本地部署,旨在建立一个能够独立交互、持续进化并与各种业务场景紧密结合的智能协作伙伴。
此外,文本还提供了关于模型、工具、训练等方面的详细信息。
## [mattshumer/Llama-3-8B-16K · Hugging Face](https://huggingface.co/mattshumer/Llama-3-8B-16K?continueFlag=5e163579825fe6026ed04354f826d987) 上下文翻倍的 Llama-3-8B-16K
[X 上的 Matt Shumer“I've doubled LLaMA 3's context window to 16K tokens. Fully open-source. Link in thread: https://t.co/uPgmrVojHX” / X](https://twitter.com/mattshumer_/status/1782576964118675565)
![IMG-20241021113030500](https://pictures.kazoottt.top/2024/11/20241125-2520b26c697fc447740dd3efaea5522e.png)
![IMG-20241021113030589](https://pictures.kazoottt.top/2024/11/20241125-d92299dab87a3af4abb7b5601c0e1108.png)
# 2. 优秀应用
## [ComfyUI Workflows - Developer Community](https://openart.ai/workflows/home)
工作流模板网站,主要是
![IMG-20241021113030616](https://pictures.kazoottt.top/2024/11/20241125-18060f3d70fca34e6c14fad24897401d.png)
## Cloudflare 推出 AI Playground
[Workers AI LLM Playground](https://playground.ai.cloudflare.com)
支持免费使用多种开源模型,并且支持在 playground 调试好之后生成对应的调用代码。
![IMG-20241021113030661](https://pictures.kazoottt.top/2024/11/20241125-01d140420c59fafd9f8f9881e087a661.png)
![IMG-20241021113030688](https://pictures.kazoottt.top/2024/11/20241125-a4c112eb9e36c4e1fb353647fc859d07.png)
与此同时 cf 还提供了其他的各种好用的工具,无论对于个人开发者还是企业都推荐使用。
[Workers AI · Cloudflare Workers AI docs](https://developers.cloudflare.com/workers-ai/)
## Perplexity 推出了企业会员和企业定制服务
![IMG-20241021113030737](https://pictures.kazoottt.top/2024/11/20241125-f281f619a96b59b2a67dbef48b7fc17a.png)
亮点:
Enterprise Pro 的强大功能:能为团队提供快速、最新且可靠的复杂问题答案,无需频繁点击链接、比较答案或在网上无休止搜索。
数据安全与隐私:确保只有合适的人能看到数据,不会有不必要的信息被分享,且数据不会被用于训练,同时保障数据隐私和安全。
安全管理与控制:通过实时通知可疑行为或危险活动来管理威胁和防止数据丢失,安全政策和控制符合最高行业标准。
用户管理:轻松添加、移除和管理团队成员。
单点登录:与身份提供商安全集成,用户可通过单点登录轻松登录。
Enterprise Pro 的效益:帮助企业加速研发,如 Databricks 估计每月能为团队节省 5000 个工作小时。
定价模式:针对不同规模的企业有不同的定价方式,小公司可通过自助流程获取,大公司则可根据购买的座位数量进行灵活定价。
常见问题Enterprise Pro 是为提高生产力、发挥 Perplexity 全部功能并满足严格安全要求而设计的解决方案,能帮助人们快速获得可靠答案,还能用于询问内部数据问题。
## [Can You Run It? LLM version - a Hugging Face Space by Vokturz](https://huggingface.co/spaces/Vokturz/can-it-run-llm) 查看机器配置能否运行模型
选择模型和机器配置,可以查看这个配置能否运行对应的模型
![IMG-20241021113030790](https://pictures.kazoottt.top/2024/11/20241125-2412f7a7cb673cc10cc04221e16a7bb7.png)
## [GitHub - feiandxs/duckrush](https://github.com/feiandxs/duckrush) 搜索关键词并返回 LLM 便于处理的数据格式
一个简单快速的后端 API基于 Hono可以使用关键字在互联网上搜索相关内容并将其转换为适合 LLM 处理的格式。支持在 Cloudflare 上部署。
![IMG-20241021113030827](https://pictures.kazoottt.top/2024/11/20241125-c5d009a8bbd978934383f4c3ec3aa999.png)
# 3. 推荐资料
## [Llama 3 Fine Tune with Custom Data - Mervin Praison](https://mer.vin/2024/04/llama-3-fine-tune-with-custom-data/)
LLama3 微调教程
[How to Fine Tune Llama 3 for Better Instruction Following? - YouTube](https://www.youtube.com/watch?v=WxQbWTRNTxY&ab_channel=MervinPraison)
![IMG-20241021113030852](https://pictures.kazoottt.top/2024/11/20241125-692aff615a32b1f8197c67978bd34d38.png)
## [GitHub - datawhalechina/so-large-lm: 大模型基础: 一文了解大模型基础知识](https://github.com/datawhalechina/so-large-lm)
[大模型理论基础](https://datawhalechina.github.io/so-large-lm/#/)
![IMG-20241021113030885](https://pictures.kazoottt.top/2024/11/20241125-f4fbb07b678beb0cfdec88f21d001576.png)
本项目是一个关于大规模预训练语言模型的教程,涵盖模型的各个方面,包括数据准备、模型构建、训练策略等,以及安全、隐私、环境和法律道德等方面的知识。项目以斯坦福大学课程为基础,结合开源贡献者的补充和更新,由项目团队成员分工撰写,预计三个月完成初始版本,后续根据社区贡献和反馈进行更新。旨在为相关领域的研究者和从业者提供知识和技术,拓宽受众的知识面,降低参与开源项目的门槛,并为大型语言模型研究领域贡献资源。
## [Getting Started With Mistral - DeepLearning.AI](https://www.deeplearning.ai/short-courses/getting-started-with-mistral/?continueFlag=5e163579825fe6026ed04354f826d987) Mistral 入门教程
课程主要的内容:
“Youll learn about selecting the right model for your use case, and get hands-on with features like effective prompting techniques, function calling, JSON mode, and Retrieval Augmented Generation (RAG).”
“您将了解如何为您的用例选择正确的模型并亲身体验有效提示技术、函数调用、JSON 模式和检索增强生成RAG等功能”
![IMG-20241021113030926](https://pictures.kazoottt.top/2024/11/20241125-b4291b88a3a143cdaa6d21f04eee1866.png)
## [Financial Market Applications of LLMs](https://thegradient.pub/financial-market-applications-of-llms/?continueFlag=5e163579825fe6026ed04354f826d987) LLM 在金融市场的应用
![IMG-20241021113030976](https://pictures.kazoottt.top/2024/11/20241125-34fd203215f29c312b89c8fecc893456.png)
重点:
📈 生成式人工智能与量化交易的相似性:生成式人工智能在自然语言处理中的应用,与量化交易策略在金融市场中的应用,有许多相似之处。
🤔 人工智能在金融市场中的应用挑战:金融市场数据的复杂性和噪声性,使得将人工智能应用于金融市场充满挑战。
👏 生成式人工智能在其他领域的应用前景:生成式人工智能在金融市场的应用面临挑战,但仍有可能在其他领域发挥作用,如辅助分析师进行基础分析等。
🤖 对人工智能在量化交易中应用的展望:尽管当前生成式人工智能在量化交易中的应用前景并不明
## [AI Agents With Low/No Code, Hallucinations Create Security Holes, and more](https://www.deeplearning.ai/the-batch/issue-245/)
这篇文本主要讨论了多代理协作、语言模型的安全漏洞、GPT Store 的管理问题以及利用 RAG 改进语言模型性能等方面的内容。
![IMG-20241021113031022](https://pictures.kazoottt.top/2024/11/20241125-50b3f6d9454d536afa08d8b0e1b8aeaf.png)
## [Notion The all-in-one workspace for your notes, tasks, wikis, and databases.](https://airy-lunch-c6f.notion.site/Becoming-SMART-is-easy-using-science-85119819e23f423887265b3fc436d586?pvs=4)
本文介绍了基于科学的强大学习技巧。文中还对比了一些常见但低效的学习策略,如高亮和重读,并强调了自我测试、检索练习、间隔练习、交错学习和精细询问等有效方法的重要性。