广场
最新
热门
资讯
我的主页
发布
TheSmartApe🔥
2026-03-09 17:37:47
关注
每个人都在谈论@karpathy autoresearch,但你们大多数人其实不知道它到底做了什么。
有一个训练脚本(train(dot)py),用来训练一个小型语言模型,基本上就是一个婴儿GPT。
还有一个指令文件(program(dot)md),告诉AI代理该做什么。
你按下“开始”。代理会调整训练脚本,训练5分钟,检查分数。表现更好吗?保持。更差?还原。重复100次,整夜睡觉时完成。
这就是全部。
它实际上优化的:模型架构。不是预测。不是交易。也不是你的投资组合。
比如:
→ 4层还是8层?
→ 最佳学习率?
→ AdamW还是Muon优化器?
→ 在这台特定GPU上,哪个批次大小效果最好?
最优架构取决于你的硬件。H100需要完全不同的模型,而你的MacBook则不同。autoresearch会自动找到最适合你机器的配置。
你可以用它做的事情:
> 构建一个写代码的微型LLM,autoresearch找到最佳架构,你用你的数据集训练
> 创建一个离线在手机上运行的轻量级聊天机器人
> 训练一个模仿你写作风格的模型
> 测试“RoPE是否比ALiBi更适合小模型?”一夜内完成100个变体,而不是花3周做博士论文
> 为树莓派或边缘设备优化模型
你不能做的事情:
> 预测股价
> 寻找交易优势
> 分析电子表格
> 预测体育比赛结果
autoresearch是为那些想要构建语言模型的人设计的工具,而不是用它的人。Karpathy建立了一个自主循环,让AI改善AI。真正聪明,但它解决的是一个非常具体的问题。
而这个问题可能不是你的。没关系,只是别再假装它是别的什么。
查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见
声明
。
赞赏
点赞
评论
转发
分享
评论
0/400
评论
暂无评论
热门话题
查看更多
#
Gate2月透明度报告
5.89万 热度
#
国际油价突破100美元
15.03万 热度
#
微策略再砸12.8亿美元增持BTC
8614.81万 热度
#
哈梅内伊之子当选伊朗领袖
64.47万 热度
#
Gate蓝龙虾
3.55万 热度
热门 Gate Fun
查看更多
Gate Fun
KOL
最新发币
即将上市
成功上市
1
WKT
WKY
市值:
$0.1
持有人数:
1
0.00%
2
H
BTJ
市值:
$0.1
持有人数:
1
0.00%
3
DF
Delta Force
市值:
$2417.24
持有人数:
1
0.00%
4
YFC
YFC
市值:
$2465.41
持有人数:
2
0.23%
5
wocao
握草
市值:
$2413.79
持有人数:
0
0.00%
置顶
Gate 广场内容挖矿奖励继续升级!无论您是创作者还是用户,挖矿新人还是头部作者都能赢取好礼获得大奖。现在就进入广场探索吧!
创作者享受最高60%创作返佣
创作者奖励加码1500USDT:更多新人作者能瓜分奖池!
观众点击交易组件交易赢大礼!最高50GT等新春壕礼等你拿!
详情:https://www.gate.com/announcements/article/49802
网站地图
每个人都在谈论@karpathy autoresearch,但你们大多数人其实不知道它到底做了什么。
有一个训练脚本(train(dot)py),用来训练一个小型语言模型,基本上就是一个婴儿GPT。
还有一个指令文件(program(dot)md),告诉AI代理该做什么。
你按下“开始”。代理会调整训练脚本,训练5分钟,检查分数。表现更好吗?保持。更差?还原。重复100次,整夜睡觉时完成。
这就是全部。
它实际上优化的:模型架构。不是预测。不是交易。也不是你的投资组合。
比如:
→ 4层还是8层?
→ 最佳学习率?
→ AdamW还是Muon优化器?
→ 在这台特定GPU上,哪个批次大小效果最好?
最优架构取决于你的硬件。H100需要完全不同的模型,而你的MacBook则不同。autoresearch会自动找到最适合你机器的配置。
你可以用它做的事情:
> 构建一个写代码的微型LLM,autoresearch找到最佳架构,你用你的数据集训练
> 创建一个离线在手机上运行的轻量级聊天机器人
> 训练一个模仿你写作风格的模型
> 测试“RoPE是否比ALiBi更适合小模型?”一夜内完成100个变体,而不是花3周做博士论文
> 为树莓派或边缘设备优化模型
你不能做的事情:
> 预测股价
> 寻找交易优势
> 分析电子表格
> 预测体育比赛结果
autoresearch是为那些想要构建语言模型的人设计的工具,而不是用它的人。Karpathy建立了一个自主循环,让AI改善AI。真正聪明,但它解决的是一个非常具体的问题。
而这个问题可能不是你的。没关系,只是别再假装它是别的什么。