刷新
DataOps for LLM 的数据工程技术架构实践

博主头像 导读 在 LLM 蓬勃发展的今天,数据工程已成为支持大规模 AI 模型训练的基石。DataOps 作为数据工程的重要方法论,通过优化数据集成、转换和自动化运维,加速数据到模型的闭环流程。本文聚焦新一代数据 & AI 集成工具- Apache SeaTunnel 在 DataOps 中的核心作用,并介 ...

不可思议!7、8 年外包进了国企!!

博主头像 大家好,我是R哥。 今天分享一个非常「难以置信」的辅导案例,一个「双非二本」的兄弟从毕业就开始干外包,一直干了 7、8 年外包,从外包离职后,经过我们几个月的面试辅导,最终去了某国企,还是待遇最好的 10 家国企之一。 这兄弟是 5 月份加入面试辅导的,距离他离职已经个把月了,当时觉得我们出了很多成 ...

Conda环境Git Pull报错

博主头像 本文总结了一个在conda环境下使用git pull出现报错:symbol lookup error: /lib/x86_64-linux-gnu/libp11-kit.so.0: undefined symbol: ffi_type_pointer的问题。通过建立软链接到版本更新的系统环境下的动态... ...

几个关于gcd和lcm的数论常见定理

博主头像 今天才知道这几个定理,网上没搜到证明方式,别人不会证那我就证明一下。 定理1: \[\gcd(a^m - 1, a^n - 1) = a^{\gcd(m, n)} - 1 \] 证明: 根据 \(\gcd\) 具有 \(\gcd(a, b) = \gcd(a - b, b)\) 的性质,不妨设 \( ...

Apache Dolphinscheduler数据质量源码分析

博主头像 Apache DolphinScheduler 是一个分布式、易扩展的可视化数据工作流任务调度系统,广泛应用于数据调度和处理领域。 在大规模数据工程项目中,数据质量的管理至关重要,而 DolphinScheduler 也提供了数据质量检查的计算能力。本文将对 Apache DolphinSchedu ...

Cloudflare优选IP访问内网服务器

博主头像 Cloudflare 优选 ip 访问内网服务器 前言 众所周知,家庭内网服务器一般只有动态 ipv6 公网,且外网无法访问内网服务器的 80、443 端口,外网通过域名访问内网服务器便成了拦在新手入门的一道门槛。此片文章通过 Cloudflare 提供的 Origin Rules 重写端口实现使用 ...

【算法】KMP 与 Z 函数

博主头像 1. KMP 1.1 算法简介 可以做到线性匹配的快速匹配字符串的算法,并可以维护字符串最长公共前后缀,扩展出计算字符串周期。 在 OI 界 KMP 算法是字符串板块中很经典的算法,可以扩展出很多巧妙的解题技巧。 1.2 算法流程 1.2.1 字符串匹配 考虑 \(O(n^2)\) 暴力的匹配,瓶颈 ...

如何进行有效的绩效沟通?

博主头像 进行有效的绩效沟通,主要是要建立一个有效的绩效沟通机制,包括以下四个方面: 1、绩效沟通目标确定:明确绩效沟通的目的、对象、内容和方式,以及预期的结果和效果。 2、实施绩效管理制度的沟通:向员工介绍绩效管理制度的原则、流程、方法和标准,让员工了解绩效管理的重要性和必要性,消除员工的疑虑和抵触。 3、 ...

[Java] 浮点数的精度丢失问题与精度控制方法

博主头像 1 需求描述 场景1:两个整型相除,如何保证运算结果为浮点数?如何控制运算结果的精度(小数位数)? 场景2:针对一个浮点数,如何控制其精度(小数位数)? 2 试验 场景:两整型数相除,控制运算结果、浮点数的精度 Long number1 = 110600L; int number2 = 999; i ...

你想了解的DDS协议解决方案在这里

博主头像 作为OPEN联盟的活跃成员与AUTOSAR联盟的高级合作伙伴,经纬恒润致力于为国内外各大OEMs及供应商,提供全面覆盖TCP/IP、SOME/IP、DoIP、AVB、TSN、DDS、MQTT,以及10M、Multi-G等一系列关键技术领域的设计与测试咨询服务。 ...

2024年11月Navicat Premium最新版(17.1.5) MacOS版免费下载

该版本为MacOS专用,最新稳定版,相比旧版本,性能更高、资源占用更小、修复了频繁崩溃的bug。 navicat最新破解版本都需要关闭SIP,如何关闭可参考这篇文章 Navicat Premium 是一款非常强大的数据库管理工具,允许您在一个应用程序中同时连接到 MySQL、SQLite、Mongo ...

京准电钟:北斗卫星同步时钟(NTP授时)助力智慧教育

博主头像 京准电钟:北斗卫星同步时钟(NTP授时)助力智慧教育 京准电钟:北斗卫星同步时钟(NTP授时)助力智慧教育 京准电子科技官微——ahjzsz 第一部分 网络时间同步显示系统概述: 医院、学校网络时间同步显示系统是由高精度GPS(北斗)网络母钟、高品质,高稳定性系统网络子钟、智能化控制设备及其它配套设 ...

D. Sharky Surfing (python解)-codeforces

博主头像 D. Sharky Surfing (python解)-codeforces 原题链接: 点击传送 问题分析: 开始于位置 1,目标是到达位置 L。她的跳跃能力初始为 1,可以在当前位置 x 跳到区间 [x,x+k] 内的任意整数位置。路径上有 n 个障碍(以区间 [li,ri] 表示),她 不能在 ...

读数据质量管理:数据可靠性与数据质量问题解决之道08扩展异常检测

博主头像 1. Python和机器学习扩展异常检测 1.1. 机器学习有助于大规模数据可观测性和数据监控 1.1.1. 配备了机器学习的检测器可以更灵活地应用到更多的数据表上,从而消除了随着数据仓库或数据湖的增长进行手动检查和手动操作的需要 1.1.2. 机器学习检测器可以实时学习和适应数据,并且可以捕获到人 ...

02day

博主头像 DOS常用命令 windows下打开命令行窗口:1、在指定的文件下按住shift + 右键打开命令行窗口 ​ 2、在资源管理器的文件导航中输入cmd+ “ ”+路径 #盘符切换 盘名字: #查看当前目录下的所有文件 dir #切换目录 cd + 文件路径(如果想在这里切换磁盘则要输入/d 盘名:) ...

『模拟赛』NOIP2024加赛6

博主头像 Rank 大奋场,T3 没切有点菜 A. 草莓 和前天多校 T3 很像,所以一眼鉴定为贪心,从大到小选比从小到大选一眼优,代价一样时横竖无所谓先后,然后 sort 一遍就做完了,复杂度 \((n+m)\log(n+m)\)。10min 切的。 点击查看代码 #include<bits/stdc++. ...

IDEA如何导入项目,包括从git仓库(github)导入项目

博主头像 前言 大家好,我是小徐啊。自从使用了IDEA开发Java应用后,我再也不想使用eclipse了。IDEA的好处真的太多了。今天小徐就来介绍下IDEA的入门知识,也就是如何导入一个项目。 IDEA如何导入项目 首先,打开IDEA,点击上方的文件,再点击下新建,然后点击从现有来源项目这个选项。 或者,我 ...

API接口的请求参数要更名,如何保持代码可读性?

博主头像 接口参数名与程序里定义的model属性名,是完全一致的吗?本文通过案例,来讲述他们之间的联系与区别。 1 我们会补贴系统对外暴露的获取收银台地址的API,响应参数是一个url地址,这个url地址包含一个参数,就是我们的订单号。形如:http://***.com/#/pages/orderPay/in ...

<1···678···100>