加入收藏 | 设为首页 | 会员中心 | 我要投稿 温州站长网 (https://www.0577zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

帮百度AI干脏活累活的公司,都死了

发布时间:2019-03-13 00:01:07 所属栏目:教程 来源:创业家
导读:文 | 李夜 在接触数据采标行业过程中,黑智听到一个陆奇和河南标注工厂的故事。 据悉,大部分河南标注工厂用的是百度的标注工具,干的是百度的活。陆奇掌旗百度时,放出了大量采标需求。当时,活不难(准确率只有90%),标注的利润空间可以达到60%—70%。

Testin云测的采标业务做得很重,比如除了众包采集外,它还会做定制化场景采集,甚至和横店影视基地合作,利用横店群演资源,搭建专属场景,完成客户的定制化场景采集。在标注方面,Testin云测又自建标注基地,与房山市政府合作用于数据标注。贾宇航表示,Testin云测所做的一切都是为了客户需求,“通过工具研发驱动保障标注的效率、精度,以及安全性。并通过项目管理、风控管理等方式,确保标注精度达到客户标准,以满足客户对于准确度的要求。”

从倍赛BasicFinder的产品基因上来看,倍赛的工具偏向于团队模式的管理工具,而不是众包模式。2018年12月,倍赛并购了欣博友,前面提到欣博友是一家运营了30年的北京数据处理公司。该公司提需求,倍赛做技术支持。“我们迭代了很多次,每个工具、快捷键、每个设置的优化,都是我们在数据生产中磨合起来的。倍赛接业务比别的公司都晚,2016年基本没接业务,2017年才开始接。我们的工具做得很扎实。”

除了欣博友,倍赛BasicFinder一直在积极拓展产能,杜霖说,目前,倍赛BasicFinder又拓展了将近3000多个人的子工厂。“通过拓展自有产能,实现最专业的服务。”2018年9月,倍赛BasicFinder收购丁火智能100%股权。丁火智能旗下“荟萃APP”已积累数十万活跃众包用户。“我们搭建了一套自主采集系统,再搭配荟萃APP实现数据采集,完成更多样性的任务。”

和Testin云测、倍赛BasicFinder不同,龙猫数据没有自己的标注团队,工具偏向众包模式。昝智和联创,出身于互联网公司,他们更希望用互联网平台化的方式去做采标,而不是“做一个纯的数据工厂”。昝智既往经验告诉他,应该让系统做这些复杂的数据处理,而不是靠人对人的管理。因为人对人的管理非常低效。

据昝智介绍,龙猫数据是较早使用众包模式做数据采标的,“我们用众包把事情做成了,很多跟进者也开始用众包去做。”昝智认为,龙猫数据打造出了“倚天剑”。他不觉得学龙猫数据的人能够做好众包,“早进入这个行业的玩家,有一把宝刀,他们用这把宝刀获得了利益,然后看到别人拿了倚天剑获得了更大利益,为了造倚天剑,他不可能把宝刀丢了。刀丢了,他们可能啥都没了。但不丢刀,他们又很难造出倚天剑。因为人的精力是有限的,思维是局限的,他们不可能一边把精力放在宝刀上,又一边造倚天剑,而且造倚天剑还比我们造得好,这不科学。”

昝智认为,龙猫数据没有宝刀,“接到客户需求,我们只能优化系统,才能保证准确产出数据。对于他们来说,接到客户需求,他们还有退一步的路可以走,那就当场监督大家认真去干。他们是有退路的,我们也没有退路,我们必须把它搞定。有退路的时候,人一急了,就容易选退路了。”据了解,目前,龙猫众包平台有400多万用户,其中只有一千多是做标注的。龙猫数据的标注业务主要由一千多个渠道商团队承担。

2.建模还是不建模?

贾宇航提到数据标注的产业链可分为三个部分:人员、工具以及算法。而Testin云测坚持做好人员+工具,不做算法。“数据具有可复制性这一特点,如果采集标注公司会算法,这有点像一个算法公司找另一个算法公司做标注,这一份数据到底是否用于乙方的提升,这中间存在一定的争议。”“我们是在数据领域服务的企业,而不是卖算法的公司。我们只负责完成企业的数据采标需求就可以了,完成了交付,我们将彻底清除客户数据。”

杜霖或许不会同意贾宇航的观点,因为倍赛BasicFinder正在打造一款傻瓜式建模系统——用户只需要输入数据,便可以得到一个AI模型。“如果客户想成立AI部门,只需要部署上倍赛的系统上,然后再找两三个AI工程师调参,就可以自己出模型了。如此,标注、采集、建模就会变成一个大闭环了,因为客户懂业务,他知道业务数据应该是什么样子。”杜霖说。

现在,倍赛BasicFinder避免直接建模,杜霖强调,“我们将我们自主研发的私有化标注系统及主流的深度学习框架,统一封装进倍赛的AI基础系统BasicAI,实现AI数据及模型的整个生命周期管理。倍赛不建模,我们只给客户提供一套底层工具,让客户自己去建模。”杜霖解释说,“Tensorflow、Keras及Pytorch这些深度学习库的出现,让建模没有门槛,未来甚至高中生都能够建模。”

如果一个汽车公司让倍赛BasicFinder帮忙做一个自动驾驶系统,杜霖表示做不了。但他也说,“我们的BasicAI实现从标注到建模的高效流程管理。客户在倍赛标数据,数据流到建模平台,客户在Tensorflow里调点参数,模型就出来了。” 今年,倍赛将推出3.0新版本,同时提供SaaS化标注工具服务,帮助客户实现数据标注管理。杜霖提到,为团队打造的采标及建模流程化工具,可以提高倍赛的业务延展性,提高竞争中的优势。

选择无优劣,但市场会给所有选择一个清晰的答案。而战国混战,或在接下来的几年见分晓。不过,客户并不希望一家独大,大树之下,寸草不生的局面。未来,数强并立的局面或将长期存在。

帮百度AI干脏活累活的公司,都死了

走向终局

一个场景,一个市场,一个产业,一个江湖。

熙熙攘攘被裹挟着进场的人,有的主动选择,有的则是被动,但一旦进入,市场和资本的逻辑发挥作用,他们你我都变成生产链上的生产要素,被挑选,被进步,亦或被淘汰。

各个产业参与者的位置,从诞生起或已被注定。从产生的那一刻起,它按着既有逻辑在走,从不以个人意志转移。上半场,草根英雄辈出,拼价格,下半场拼品牌、服务与效率。精英开始清场,草根离场或者重新站队。而资本,加速整个产业迭代。

现在,下半场刚开启,谈终局似乎有些为时过早。有太多的不确定将在接下来几年的竞争中,变得确定。但更多的不确定性,可能又会出现。城头变幻大王旗,只在一瞬之间。

黑智认为接下来几年,不确定性虽是主流,但仍有几件事是确定的:

1.下半场仍将是性价比之争。客户永远希望用最小的成本获得更高质量的数据。为了生存和在竞争中脱颖而出,供给侧不得不迎合性价比需求,他们不得不通过技术来获得降价空间和利润空间。贾宇航觉得,技术永远是最重要的。“通过技术的方式倒逼自己不要赚太多钱。如此,价格才能降下来,竞争力则提了上去。”

2.不要忽视传统公司的AI需求。毫无疑问,接下来几年,传统企业的AI需求将会出现井喷,如何抓住他们,并服务好他们,这是所有采标公司亟需思考的。当然,也不能忽视AI行业的新数据,比如3D的激光雷达以及心跳数据等。

3.不能忽视商务能力。不强的商务能力,或将成为采标公司的新短板。现阶段,它们的产品和商业模式已基本经过市场的验证。他们需要通过放大商务杠杆扩大产品的覆盖范围。

(编辑:温州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读