研究者July

研究者July

北京七月在线科技有限公司 创始人

北京七月在线科技有限公司 创始人

  • 3 公司 七月在线
查看更多 a
置顶 为何我司论文审稿模型可以超过GPT4
核心三点:数据第一关键,其次训练策略,最后llama 2

技术报告见《paper-review数据集微调LLaMA2》:O网页链接,至于数据集、代码则见「大模型项目开发线上营」O网页链接
且后来8.29日,该审稿已上线七月官网首页
L研究者July的微博视频 ​​​​
12分钟前 来自 微博网页版 已编辑
我们idp3的复现迎来大进展:idp3架构拆解完了,且还弄了一个通用架构——可以同时跑dexcap和ipd3,下周找下机器,看年前是否来得及实际部署到真机上
一旦深抠人形机器人,便很难停下来了

《iDP3——改进3D扩散策略以赋能人形机器人的训练:不再依赖相机校准和点云分割(含DP3、Diff-Control、ControlNet详解)》O网页链接 ​​​​
今天 11:51 来自 微博网页版 已编辑
《一文速览CogACT及其源码剖析:把OpenVLA的离散化动作预测换成DiT,逼近π0(含DiT的实现)》O网页链接 ​​​​
今天 01:27 来自 Xiaomi MIX 4 已编辑
时不时有朋友和我吐槽,为何在CSDN上写..
真没有啥特别的原因,就是十多年来 在上面写习惯了

每天看paper之外,我也偶尔会看别人在「非CSDN的平台上」写的文章,但CSDN上其他人写的,我确实不看.. ​​​​
《一文通透OpenVLA及其源码剖析——基于Prismatic VLM(SigLIP、DinoV2、Llama 2)及离散化动作预测》O网页链接 ​​​​
1月12日 11:19 来自 Xiaomi MIX 4 已编辑
七月也是过去两年 转型为科技公司,有内部的大模型和具身开发团队、内部的大模型产品

才能抽取部分内容
作为C端学员可以写到简历上的商业项目 ​​​ ​​​​
1月11日 00:54 来自 Xiaomi MIX 4 已编辑
具身VLA模型cogACT的源码结构还是很清晰的
​想改造一个模型结构,得先把源码抠完 ​​​​
1月10日 13:35 来自 Xiaomi MIX 4 已编辑
过去一年,看具身paper关注点的变化
1 一开始最关注的是模型 架构,觉得算法多牛逼
2 后来 是数据,因为有数据才有一切
3 现在是应用场景,算法和数据只是让技术完美了,但离落地完美 还有差距

之后,是都会重点关注,因为这三者是相辅相成的 ​​​ ​​​​
1月10日 11:57 来自 Xiaomi MIX 4 已编辑
当在大模型和具身领域 做的越深入,则发现里面的算法和工程细节越多

反倒对抽取其中部分出来弄成课程这件事,越来越谨慎了
以前对弄课反而大胆些,这可能就是从几年前培训心态变成「如今这两年开发心态」的缘故吧 ​​​​
针对之前一篇文章的标题做了下修改,且新增几个相关算法的解读

《让VLM充当机器人大脑——做顶层任务规划:从SayCan、VoxPoser、RoboFlamingo到清华ViLA、Figure 01、CoPa》O网页链接 ​​​​
刚给下文新增了对「Google具身多模态模型PaLM-E」的介绍,^_^
由于近期各种VLA模型 出来的比较多,而对于VLA而言,RT-2是绕不开的两个里程碑

故刚把本文《Google视觉机器人超级汇总:从RT、PaLM-E、RT-2到RT-X、RT-H(含Open X-Embodiment数据集详解)》O网页链接中的
RT-1和RT-2 做了比较大的修订与优化 ​​​​
这两年在大模型和具身上的积累/学习,没有任何一丝丝天赋可言,全是夜以继日的勤奋与努力:

1 天天看paper
2 和团队的实践
3 和很多业界同行的交流、讨论 ​​​​
昨天我还在思考,对多token预测举的例子(在下面链接中的4.1.3节 )是否妥当,刚解决了,昨天原来的表述确实有问题——在和同事做了深入的讨论/验证之后,目前已经修正
因在英文层面的论文审稿、翻译之后,我们要再搞一个面向中文的「硕士论文修订助手」,故注意到了这个DeepSeek

《一文通透DeepSeek-V3和其V2版本(改造Transformer的中文模型):详解MoE、GRPO、MLA》O网页链接 ​​​​
今天修订了本文的几个小地方,如有同学正在复现该rekep或其他机器人,可以私我,加相关交流群
正在写新一篇blog,《ReKep——李飞飞团队提出的让机器人具备空间智能:基于视觉语言模型和关键点约束》O网页链接

毕竟在这种高科技领域,那关注世界级前沿 是必不可少的
在大模型和机器人这两个方向不断深挖,就像深海挖井,为达预期 虽两万里亦往矣 ​​​​
1月7日 19:46 来自 Xiaomi MIX 4 已编辑
现在对和高校联合培养具身人才,很有兴趣,今天便和一985实验室 开始联合培养硕/博生,也是为我司七月培养具身人才,更是为和高校的合作 做铺路

这事于我也是荣幸一件 今年早日做出成果 ​​​​
1月7日 13:25 来自 Xiaomi MIX 4 已编辑
昨晚为了举例说清楚Multi-Token Prediction,从零点肝到了凌晨一点多
算把V3中较难的GRPO MLA 多token预测 都解读完了,V3中剩下的可以慢慢解读了

一文通透DeepSeek-V3和其V2版本(改造Transformer的中文模型):详解MoE、GRPO、MLA、Multi-Token预测
O网页链接 ​​​​

正在加载中,请稍候...