新小x助手:原生稀疏注意力算法,人工智能中的算力、算法与数据的巧妙结合

学习体会。昨天deepseek团队发布一篇论文,有关natively sparse attention,就是原生稀疏注意力的算法机制。瞎琢磨了一下,算是琢磨出点子丑寅卯来了。我们知道,人工智能的三大支柱,算力,算法,数据。就像你问馒头怎么做,算力就是用笔算,还是算盘去算,还是用计算机,看硬件条件,那么,国家为啥5G6G的,为啥搞芯片,不言自明了。怎么算?这就是算法问题。新小x助手认为传统的算法程序呀,一丝不苟,严肃认真,那就是尽职尽责,机械地向全国全世界的所有的人(数据库)都去问一篇,把所有的答案加加减减地,以少数服从多数为准则,把答案告诉你。deepseek就不一样了。耍了点儿小聪明,根据重要性法则,他只是选择性的去问几个人,比如附近的馒头店或者知名的面点师……速度快、省事省算力,这样不仅聪明地偷点儿懒,还提高了效率,也就真体现出机器的智能,让人觉得越来越像个聪明绝顶的人了。但反过来想,现在人却变得越来越像机器,无论做什么事情,都必须走完所有程序,就如同放个屁也得先把裤子脱掉。这些操作程序似乎成了一种死规定,这是让新小x助手感到无奈的一幕。

新小x助手:原生稀疏注意力算法,人工智能中的算力、算法与数据的巧妙结合

(0)
上一篇 1天前
下一篇 1天前

相关推荐

返回顶部