Open R1 项目进展第一期
DeepSeek R1 发布已经两周了,而我们启动 open-r1 项目——试图补齐它缺失的训练流程和合成数据——也才过了一周。这篇文章简单聊聊: Open-R1 在模仿 DeepSeek-R1 流程和数据方面的进展 我们对 DeepSeek-R1 的认识和相关讨论 DeepSeek-R1 发布后社 ...
Midscene与Qwen-VL模式小试UI自动化
背景Midscene.js是一款由字节跳动Web Infra团队开发的开源、基于AI技术的UI自动化工具,其应用场景广泛且多样:1. 自动化测试功能测试:Midscene.js能够模拟用户操作,如点击按钮、输入文本等,对Web应用进行功能测试,确保应用在不同情况下都能稳定运行。冒烟测试:对于简单的站 ...
万字长文详解Text-to-SQL
什么是Text-to-SQL 在各个企业数据量暴涨的现在,Text-to-SQL越来越重要了,所以今天就来聊聊Text-to-SQL。 Text-to-SQL是一种将自然语言查询转换为数据库查询的技术。它可以让用户通过自然语言来查询数据库,而不需要编写复杂的SQL语句。 Text-to-SQL的应用 ...
AI开发系列一:概念扫盲
大模型演变与概念 人工智能 人工智能是一个非常广泛的领域,涵盖了多种技术和方法,包括但不限于机器学习、自然语言处理、计算机视觉、专家系统、机器人学等。 人工智能旨在创建能够模拟人类智能行为的系统或软件。它包括感知、推理、学习、决策和语言理解等多种能力,目标是让计算机能够像人类一样思考和行动。 在人工 ...
【AI News | 20250327】每日AI进展
AI Repos 1、playwright-mcp 使用Playwright提供浏览器自动化功能的MCP服务,核心是让LLM通过结构化的可访问性快照与网页交互,不需要依赖截图或视觉模型。可以用来自动填写网页表单、自动收集网页信息、自动进行网页测试等。支持两种模式:快照模式(默认):使用可访问性快照; ...
让 LLM 既能“看”又能“推理”!
DeepSeek-R1 会推理,GPT-4o 会看。能否让 1 LLM既能看又能推理? DeepSeek-R1取得很大成功,但它有个问题——无法处理图像输入。 1.1 DeepSeek模型发展 自2024.12,DeepSeek已发布: DeepSeek-V3(2024.12):视觉语言模型(VLM ...
Function Calling 执行流程和历史消息结构
在 function calling(工具调用)的场景中,传递给大语言模型(LLM)的历史消息需要包含完整的对话上下文,包括用户输入、模型生成的工具调用请求(tool_calls),以及工具执行后的返回结果。以下是详细的格式说明和示例: 核心流程与消息结构 用户提问 → 2. 模型生成工具调用请求 ...
为什么 AI 模型离科学革命还差得很远?
作者:Thomas Wolf, Hugging Face 联合创始人和首席科学家 发布日期:2025 年 2 月 26 日 原文链接: The Einstein AI model 几天前,我在一个活动上分享了一个略显争议的观点,后来我决定把它写下来:我担心人工智能无法带来所谓的“压缩的 21 世 ...
常见的 AI 模型格式
来源:博客链接 过去两年,开源 AI 社区一直在热烈讨论新 AI 模型的开发。每天都有越来越多的模型在 Hugging Face 上发布,并被用于实际应用中。然而,开发者在使用这些模型时面临的一个挑战是模型格式的多样性。 在本文中,我们将探讨当下常见的 AI 模型格式,包括: GGUF PyTorc ...
AI穿上身:苹果手表如何改变你的生活?
楔子:一个普通理工男的科技启示录 我是张三,一个标准的90后理工男。在这个日新月异的科技时代,我习惯用精密的逻辑和近乎机械的效率来审视世界。每天早上6点45分准时起床,每一分钟都被精确地规划,生活就像一台运转良好的精密仪器。然而,就在今年3月的某个平凡日子,一则关于苹果AI智能手表的新闻,彻底颠覆了 ...
vue3-webseek网页版AI问答|Vite6+DeepSeek+Arco流式ai聊天打字效果
2025 AI实战vue3+deepseek+arcoDesign仿DeepSeek/豆包网页版AI聊天助手。 vue3-web-deepseek 实战网页PC版智能AI对话,基于vite6+vue3.5+openAI对接DeepSeek-Chat聊天对话模型。实现流动式打字返回效果、支持亮色+暗黑 ...
(踩坑)windows本地部署Dify ,玩转智能体、知识库
windows 安装docker windows 本地部署deepseek windows 通过docker本地部署dify 一:安装Docker 前提: 开启Hyper-V 打开 控制面板 - 程序 - 启动或关闭windows功能 在对话框中分别选中打开: 开启WSL2 打开cmd 运行 wsl ...
《DeepSeek原理与项目实战》 | PDF免费下载
DeepSeek 是一种基于 Transformer 架构的生成式 AI(Artificial Intelligence)大模型,融合了MoE 架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型 DeepSeek-V3 的核心技术及... ...
cs231n-图像分类:kNN与线性分类器
声明:根据ppt以及子豪哥的讲解,同时含有自己的一些理解,逐渐构成的该部分文章。若有哪里有问题,欢迎各位积极提出宝贵的意见,谢谢大家。 十分感谢cs231n的课程老师以及b站up主:同济子豪兄 1.概述 图像分类,物体检测。 宗旨: 2.图像分类:kNN与线性分类器 图像分类:只要检查出对应物体的类 ...
OpenAI的GPT-4o:普通人的AI秘书来了
1. 惊艳时刻:AI比你想象的更"人性" 早餐时,张三正埋头刷推送,一篇关于OpenAI发布GPT-4o的文章瞬间点燃了他的好奇心。这个AI简直是科技圈的惊雷!竟然可以像真人一样说话、理解语境、实时交互,甚至能读懂你的情绪。这哪里还是以前那个机械的聊天机器人,简直就是随时待命的智能秘书。 2. 黑科 ...
基于Python程序访问本地部署的DeepSeek和硅基流动DeepSeek API
前排提醒: 1. 本地通过Ollama部署DeepSeek,部署版本为 deepseek-r1:1.5b,若还未进行本地部署,可以参考博客Windows系统上使用Ollama本地部署DeepSeek 2. 线上API使用的是硅基流动(siliconflow)的DeepSeek API,模型名称为 d ...
在HTML页面通过JavaScript访问DeepSeek-R1(使用硅基流动Api)
前排提醒: 1. 操作系统为Windows11 2. DeepSeek使用的是硅基流动(siliconflow)的API,模型名称为 deepseek-ai/DeepSeek-R1 第一步: 在硅基流动官网的API密钥菜单( https://cloud.siliconflow.cn/account/ ...
Ollama系列06:C#使用OllamaSharp集成Ollama服务
本文是Ollama系列教程的第6篇,主要介绍如何通过SDK将ollama集成到c#程序中。 Ollama系列教程目录(持续更新中): 轻松3步本地部署deepseek 快速上手搭建私有的AI对话框和智能体—chatbox版 快速上手搭建私有的AI对话框和智能体—cherryStudio版 进阶篇-搭 ...
在HTML页面通过JavaScript访问Ollama本地部署的DeepSeek
在HTML页面通过JavaScript访问Ollama本地部署的DeepSeek,顺便解决了 HTML 页面调用 Ollama 服务的跨域问题 ...
【调研】Vision Language Model Safety
Adversarial Attacks White-box Attacks Task-specific Attacks 的目标是针对某个具体的任务(如图像描述生成、指代表达理解等),通过精心设计的对抗样本,使得模型在该任务上产生错误的输出。例如,攻击者可能希望模型生成错误的图像描述,或者在对图像进行 ...