Bittensor白皮书及文档解读

项目动机与创新

当前人工智能模型的训练主要由监督学习驱动，作为最常见、最成熟的机器学习范式之一，其主要思想是利用标记数据集来衡量模型的性能，进而指导模型的迭代、优化。不可否认，监督学习的思想能够对模型在某些具有明确定义的任务上的表现定量评估，这在模型优化场景是非常有效的，但这种相对单一的评价机制难以适应当下市场化、多元化的模型评估场景，带来以下潜在的问题：

单一评价指标无法全面地衡量模型的价值。
例如，有些模型在数值精度上可能不是最优的，但其具备的一些特性（如：可解释性）仍然使它在特定场景有存在的价值和必要。这还包括一些遗留系统，尽管这些系统可能不再是最新的，但往往因适应特定需求，具有无可替代的独特价值。
赢家通吃的竞争格局导致中心化问题。
大型企业为了在赢者通吃的竞争中取得成功，需要集中资源、算力训练大型单一模型，这限制了智能系统的多样化发展和传播，同时也导致了一定的中心化问题。我们需要一个更加多元化的模型评价标准，让存在于利基市场的模型。

基于以上痛点，bittensor通过设计了一个 大众评议 机制，通过改变人工智能的评价标准，有望充分奖励那些能够应用于更大规模、更多元化目标的智能系统。同时，对于特定垂直领域的专家系统、遗留系统等，这套机制能一定程度上促进他们的价值发现，有助于增加智能系统的多样化发展。

系统架构

Bittensor生态系统由以下三个部分组成（见图1）

Bittensor由多个子网构成，每个子网对应一个任务。子网创建者可以创建自定义的 激励机制，挖矿者可以加入Bittensor生态系统中已经存在的子网参与竞争。
运行子网并支持其正常运行的 区块链 ，支撑一个无许可、抗合谋、去中心化的竞争市场。
Bittensor API 连接了连接了子网和区块链。
图1.Bittensor总体架构

用户

用户主要可以以下角色参与Bittensor生态系统:

子网所有者: 创建子网。
子网验证者：运行子网验证器。
子网矿工: 运行适配子网任务的模型。

子网

子网的运行机制如下，编号对应上图2中的数字。

每个子网独有一套特定的激励机制和任务。
子网的矿工，执行模型，解决子网激励机制中定义的任务。
每个子网验证器都独立地评估子网矿工执行的任务。
然后，每个子网验证者都表达了他们对各个矿工质量的看法。然后，子网验证器的这些意见通过使用Bittensor API作为聚合输入提供给区块链上的共识层。
最后，共识机制的输出将决定如何分配子网矿工和子网验证者的奖励。奖励以$TAO的形式分发。
图2.子网运行机制

总结

依据上述介绍，大致能明白这个项目在讲一个怎样的故事和它实际的运作机理。随着近期AI概念的火爆，代币价格上涨，网络上也充斥着各种吹爆这个项目的文案。实际上这个项目本身就不那么容易理解，其白皮书、文档仿佛在故意设置障碍，公式的描述中对于符号的定义不够规范，在文档的描述中，也常常能感受到作者有偷换概念之嫌。总之该项目当前还处于炒作阶段，你可能看到项目方发布悬赏创建一个又一个的子网，但实际上这都只是挖矿行为，没有听说过任何来自真实场景的业务收入。
我们最后来回答几个问题作为收尾。

这个项目的模型是开源的吗？
答：不一定，从子网部分的介绍就能看出，运行什么模型取决于矿工，模型是否开源也取决于矿工，所以网络所谓该项目完全开源、透明是不准确的。
这个项目能用来做模型训练吗？
答：不能。模型的“训练”和“推理”是两码事，很多人会类比RNDR算力中介的故事，这是不准确的，矿工不是在进行模型的训练，只是在运行模型，让模型把数据‘吃’进去，然后输出一个模型的推理结果。确切地说Bittensor更像是一个劳务市场。
真的能解决所谓的赢家通吃问题吗？
答：不一定，尽管子网的设定几乎能保证AI的各个细分场景都能去开辟一个子网，能够保证模型种类的多样性，但如上所述，每个子网中都有验证器给各个矿工打分，实际上如果激励策略设置的不合理，最终子网内部还是会导致赢家通吃的局面。
“Bittensor已经服务了超过xx万亿模型参数，远超过了GPT的参数量。”，这种说法合理吗？
答：不合理。Bittensor运行了多个子网，每个子网的任务不同，模型架构不同，算总参数量没有任何意义。

参考资料

This article is licensed under CC BY-NC-SA 4.0, please cite if you intend to reproduce.