几十年来,自动驾驶汽车一直是科幻电影中的场景,但现在我们已经为汽车配备了各种传感器、芯片和软件。嗯,他们仍然是这样。
这并不是说该行业没有向前发展——它正在因令人兴奋的新举措和相关事件而成为头条新闻。但即使是它的一些先驱者也对这一进展提出质疑,而这些头条新闻下的故事都是非常熟悉的头条新闻:谷歌的 Waymo、苹果、通用汽车等。人们会而且应该预料到在这样一个具有颠覆性的市场中会有更多真正的颠覆者。
事实是,无人驾驶汽车堆栈中的一些底层技术非常有利于中心化和巨大的中心化参与者。或者说乍一看似乎是这样。
显然,用胶带将摄像头粘在汽车上不会神奇地教它开车,但将摄像头连接到车载计算机上也不会。就计算机而言,摄像头输入只是另一个数据流。人脑有一个复杂的神经连接系统,可以从视觉信号中提取可操作的见解,而计算机也需要类似的东西。它需要自己的愿景。
计算机视觉是更广泛的人工智能(AI)行业的一个子领域,更准确地说,是机器学习(ML),它使无人驾驶汽车能够“看到”周围的世界。人工智能算法通常用于处理其他传感器反馈,例如激光雷达,从而增强车辆在物理空间中导航的整体能力。这些模型的问题在于它们需要大量的数据来训练。
公司对模拟数据集能走多远持谨慎态度,长期以来一直在努力获取真实世界的数据来训练他们的模型。无人驾驶汽车行业也不例外。虽然公司可以使用模拟(就像您在视频游戏中看到的那样)来记录各种场景并引导他们的数据集,但它只能帮助您到此为止。从天气状况到地区具体情况,现实世界的数据对于确保自动驾驶汽车安全可靠至关重要——这就是为什么旧金山居民可以看到无人驾驶出租车在没有乘客的情况下行驶几个小时。他们不是在寻找乘客;而是在寻找乘客。他们正在收集数据。
以能够维持业务的速度收集足够规模和质量水平的数据集的挑战是自动驾驶汽车行业的一个障碍,这将使竞争环境变得不平衡,使其转向大型中心化实体。中心化巨头可以收集大量数据,而新来者则面临着阻碍其进步的数据挑战。它给一个新兴且充满希望的市场蒙上了寡头垄断的阴影,我们都知道这对普通人意味着什么。
解决方案已经存在,每天有成千上万辆汽车行驶在每个城市和每个国家的道路上。他们中的大多数人在行驶中捕获大量数据,如果有适当的激励,司机可能会自己做标签。看看验证码——行人、摩托车和交通信号灯的测试都是数据标记的练习,人们只是为了访问网站或服务而执行这些测试。
将所有这些数据积累到庞大的集合中将为新兴的初创公司和企业提供他们的模型可能需要的所有现实世界的学习材料。这些数据集可以根据需要多样化或针对具体位置,植根于现实世界的场景、条件和细节。然而,为了解锁对数据的访问,该行业首先需要一个全新的数据范式。
这种范式必须利用区块链作为共享且供应商中立的核心基础设施和交易层,以防止另一个孤立的生态系统的兴起。它还必须利用驾驶员和车辆的自主数据和身份,将数据和隐私的控制权交还给他们。
自我主权身份将充当 web3 钱包,存储由受信任机构(例如当局或汽车制造商)发布的各种用户属性的加密证明。数据消费者将能够使用这些数据来验证卖家(在本例中为司机)可以选择出售的数据。这一前景并不像看起来那么遥不可及,web2 和 web3 公司都已经在开发区块链驱动的移动基础设施,例如欧洲的 Gaia-X moveID。
这种自我主权的数据范式将使驾驶员成为数字移动领域的积极利益相关者,使他们能够将日常通勤中生成的数据货币化。它还将解决整个自动驾驶汽车行业的数据集挑战,让所有参与者平等地进入原始数据的共享市场,从而为该行业带来急需的推动力。
尽管他们做出了所有承诺,但真正的自动驾驶汽车仍然难以实现,部分原因是收集数据集以训练有助于驾驶此类汽车的人工智能模型所面临的挑战。拥抱 web3 数据范式是业界解锁几乎无限的训练数据池的最佳机会,同时还能保持健康的开放竞争精神。
本文由 Ocean Protocol 联合创始人 Sheridan Johns 和 共同撰写Leonard Dorlöchter,peq 联合创始人。