AI
刷新
一套低成本、高质量的替代AI数字人/唇形同步方案

博主头像 随着自媒体和电商的蓬勃发展,AI技术正成为内容创作和营销的新宠。最近,我身边一位做自媒体的朋友为了推广店铺,接触到了一家新媒体公司。这家公司推出了一款小程序,宣称只需上传一段真人朗读数字(如“12345...”)的视频,就能根据文案生成AI克隆声音并实现唇形同步的视频。听起来是不是很酷?当你还在一天 ...

Open R1 项目进展第二期

博主头像 我们启动 Open R1 项目 已经两周了,这个项目是为了把 DeepSeek R1 缺失的部分补齐,特别是训练流程和合成数据。 这篇文章里,我们很高兴跟大家分享一个大成果: OpenR1-Math-220k,这是我们打造的第一个大规模数学推理数据集! 除此之外,我们还聊聊社区里一些让人兴奋的进展, ...

DeepSeek 会话补全 API

博主头像 DeepSeek 会话补全 API 是一个超强大的 AI 对话接口 ,可以让你:- 打造自己的 智能聊天机器人 - 让 AI 帮你 写文章、改代码、编故事 - 甚至模拟 各种角色(比如猫娘、霸道总裁、科幻作家…) ...

DeepSeek 聊天机器人项目

博主头像 想要更深入玩转聊天机器人开发? 推荐本文档 + 课程《DeepSeek 聊天机器人项目》一起学习,效果翻倍!✨ 边学边练,轻松打造智能对话系统~ (๑•̀ㅂ•́)و✧ 快上车,AI 之旅发车啦! 一、为 DeepSeek Chatbot 准备零件 项目演示 输入提示词: Who are ...

大模型备案全网最详细流程解读(附附件+重点解读)

博主头像 文章目录 一、语料安全评估 二、黑盒测试 三、模型安全措施评估 四、性能评估 五、性能评估 六、安全性评估 七、可解释性评估 八、法律和合规性评估 九、应急管理措施 十、材料准备 十一、【线下流程】大模型备案线下详细步骤说明 十二、【线上流程】算法备案填报流程及重难点分析 十三、大模型备案时间成本对 ...

Spring AI 增加混元 embedding 向量功能

博主头像 上次我们讨论了如何将自己的开源项目发布到 Maven 中央仓库,确保其能够方便地被其他开发者使用和集成。而我们的项目 spring-ai-hunyuan 已经具备了正常的聊天对话功能,包括文本聊天和图片理解等基础功能。今天,我们进一步优化和扩展了该项目,新增了一个向量化功能。如图所示: 好的,首先就 ...

如何使用 OpenAI Agents SDK 构建 MCP

博主头像 1.概述 OpenAI Agents SDK 现已支持 MCP(模型上下文协议),这是 AI 互操作性的重大变革。这使开发人员能够高效地将 AI 模型连接到外部工具和数据源。本篇博客,笔者将指导使用 OpenAI Agents SDK 构建 MCP 服务器,以增强你的 AI 应用程序。 2.内容 2 ...

Julia使用transformer训练数据预测模型

博主头像 一、任务描述 选取各检测设备工艺运行参数1534个。 每分钟记录1条数据。 根据1个小时的60条数据预测未来30分钟的30条数据。 二、模型描述 输入大小60*1534,输出大小30*1534 三、主要参数 输入长度in_len 60,输出长度out_len 30,特征值feature_dim153 ...

哈工大|82页《人工智能:从图灵测试到DeepSeek》,重磅解析人工智能史诗级进化!| PDF+MP4教程免费下载

《人工智能:从图灵测试到DeepSeek》是由哈尔滨工业大学计算学部人工智能学院张伟男教授团队撰写的公开课文档,系统梳理了人工智能的发展脉络、核心技术及行业应用,并展望了其未来趋势。该文档结合理论与实践,既涵盖学科基础知识,又深入探讨了前沿技术突破,体现了中国在人工智能领域的科研实力与教育成果。 ...

Python+硅基流动API实现小说转有声读物

博主头像 一、注册硅基流动账号获取文本转语音api 1.注册登录硅基流动 注册、登录硅基流动 查看apikey 查看赠送的免费额度 点击文档中心 2.查看文本转语音api 查看文本转语音api 查看api使用指南 查看文本转语音api的python调用方法 二、python实现文本转语音功能 1.python ...

AI 应用思考

之前看到过一个理论,创新技术的三个阶段:新技术创造-精英服务-平民化 技术扩散的三阶段理论模型 1. 创新垄断期(精英创造阶段)技术革命初期,创新活动高度依赖知识密集型投入。AI发展呈现"分层技术"特征,核心算法突破仍由顶尖科研团队主导。 2. 价值捕获期(服务精英阶段)新技术商业化过程中,受益群体 ...

喜提好人卡?混元模型模块独立维护与开源发布

博主头像 接着我们上次向Spring AI提交的混元模型模块,我已经完成了所有关于混元的聊天对接,并提交了相应的PR描述。提交后,荣获了一张“好人卡”,如图所示: 今天,我们决定将之前提交给Spring AI官方的PR重新拿出来,并准备将其独立维护在一个开源仓库中。做出这一决策的原因是Spring AI官方表 ...

基于Cline MCP实践FireCrawl

博主头像 背景FireCrawl MCP是一款基于MCP协议的企业级网页爬虫服务器,由Mendable.ai开发,专为高级网页抓取设计。它整合了FireCrawl的网页抓取能力,通过MCP接口将强大的网络爬虫功能暴露给大型语言模型(LLM),如Claude、Grok、Cursor等,使智能体能够抓取网页、处理 ...

Ollama本地部署大模型总结

博主头像 日拱一卒,功不唐捐 今天计划对之前ollama系列做个回顾,从如何部署到API使用,整理到一篇内容中,提供给大家参考。 安装指南 第一步:安装ollama 我们可以从官网下载ollama,此步骤支持windows、mac、ubuntu操作系统,此处仅以windows作为演示。 打开ollama官网: ...

Open R1 项目进展第一期

博主头像 DeepSeek R1 发布已经两周了,而我们启动 open-r1 项目——试图补齐它缺失的训练流程和合成数据——也才过了一周。这篇文章简单聊聊: Open-R1 在模仿 DeepSeek-R1 流程和数据方面的进展 我们对 DeepSeek-R1 的认识和相关讨论 DeepSeek-R1 发布后社 ...

Midscene与Qwen-VL模式小试UI自动化

博主头像 背景Midscene.js是一款由字节跳动Web Infra团队开发的开源、基于AI技术的UI自动化工具,其应用场景广泛且多样:1. 自动化测试功能测试:Midscene.js能够模拟用户操作,如点击按钮、输入文本等,对Web应用进行功能测试,确保应用在不同情况下都能稳定运行。冒烟测试:对于简单的站 ...

万字长文详解Text-to-SQL

博主头像 什么是Text-to-SQL 在各个企业数据量暴涨的现在,Text-to-SQL越来越重要了,所以今天就来聊聊Text-to-SQL。 Text-to-SQL是一种将自然语言查询转换为数据库查询的技术。它可以让用户通过自然语言来查询数据库,而不需要编写复杂的SQL语句。 Text-to-SQL的应用 ...

AI开发系列一:概念扫盲

博主头像 大模型演变与概念 人工智能 人工智能是一个非常广泛的领域,涵盖了多种技术和方法,包括但不限于机器学习、自然语言处理、计算机视觉、专家系统、机器人学等。 人工智能旨在创建能够模拟人类智能行为的系统或软件。它包括感知、推理、学习、决策和语言理解等多种能力,目标是让计算机能够像人类一样思考和行动。 在人工 ...

123···50>