加入收藏 | 设为首页 | 会员中心 | 我要投稿 温州站长网 (https://www.0577zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

大数据时代的爱与怕

发布时间:2019-03-30 18:56:56 所属栏目:教程 来源:AI财经社
导读:撰文/ 王先 郑亚红 编辑/ 严冬雪 2015年9月,万众创业的风势正猛,一位创业者找到我,安利他正在筹备的一个项目,主营业务是为企业做员工离职预报,他坚称市场前景非常可观,问我要不要报道。阅世甚浅的我感到十分新奇,然后拒绝了他。 再次听到他的消息是

大数据时代的爱与怕

大数据时代的爱与怕

撰文/ 王先 郑亚红

编辑/ 严冬雪

2015年9月,万众创业的风势正猛,一位创业者找到我,安利他正在筹备的一个项目,主营业务是为企业做员工离职预报,他坚称市场前景非常可观,问我要不要报道。阅世甚浅的我感到十分新奇,然后拒绝了他。

再次听到他的消息是在3年半之后,3月25日,号称拥有中国最大简历数据库的巧达科技被曝已被警方查封,或涉嫌多款产品在未被授权情况下抓取用户简历等信息。这家公司的法人兼大股东王成予正是当年那位创业者。

巧达科技爆雷,距离央视315晚会曝光WiFi探针盗取个人手机号码、外卖App疑似“窃听门”不过一两周时间;3月27日,北京市消协发布大数据“杀熟”调查,认为去哪儿网、飞猪旅行确实涉嫌有“杀熟”行为。有声音将近期一系列动作解读为监管部门正掀起对大数据黑产的新一轮打击。

你的姓名、年龄、身份证、收入、喜好、购买记录……这些数据的主权还在你手上吗?它们被倒卖了多少轮?到底有多值钱?有知情人士透露,以医疗数据为例,由于用户转化率高、数据获取难,一例透析病人的数据可被炒到8000元。

2018年,上海交通大学邵国松教授等人选取了中国500家有影响力的网站,对其隐私政策声明进行分析,核实其是否较好地执行了《网络安全法》相关条款。结果发现,收集个人信息的网站在所有类别网站中都占据了极高比例,其中教育类网站收集比例高达100%,商业类网站需要身份识别的也达84%。

01

公开资料显示,巧达科技成立于2014年7月,数据来源为“乔大招”,包括之前为企业做员工离职预报的“爱伙伴”在内,其旗下10多款招聘工具均为免费产品,这些产品通过爬虫等技术在网上抓取简历后投入数据库,再向企业提供相关人才信息服务。

有在线招聘头部公司人士认为这些数据过于夸张,她对AI财经社表示,这种爬虫技术会触及很多相关企业利益,所以一般公司都会设有反爬机制。

“燃财经”拿到的一份巧达数据的商务计划书则显示,该公司旗下有38个B端招聘产品、超过170万招聘者用户,自称有超过10亿份通讯录、拥有超过8亿自然人的信息,通过简历解析,可以对自然人产生包括社会关系、组织关系、家庭关系及区域位置等定位,几乎涵盖个体所有关键信息维度。

巧达科技将这些数据用在招聘、电商、影视、保险、金融等行业。这为巧达科技在2016年带来1.2亿元营收,其中净利润即达4800万元,到2017年,两项数字激增至4.11亿元和1.86亿元。

王成予曾公开宣称,“简历是最有价值的自然人数据。巧达数据通过大数据及人工智能技术研发的认知引擎,能够快速还原网上自然人的清晰画像,为商家提供实用的营销方案。超过170万家互联网企业和猎头公司在使用相关产品”。

巧达科技在2014年11月得到创新工场数百万美元A轮融资,2017年1月再次得到中信产业基金数千万人民币B轮融资。

至于创始者王成予本人,则由中国裁判文书网曝露了更多信息,2016年3月《北京市第三中级人民法院民事判决书》中显示,王成予在2011年5月之前的十几年里,存在多次违法犯罪记录,包括盗窃、诈骗等,其中包括2006年轰动一时的涉嫌敲诈勒索华硕公司一案。

更多的事情并非出自惯犯之手。2019年315晚会上,央视曝光“探针盒子”,当个体手机Wifi处于开启状态,就可能被探针盒子捕获,并转换获取手机号码。探针盒子不仅可以强制用户手机弹窗,冒充已连接WiFi在微信置顶界面投放无法消除的广告,甚至还能拨打骚扰电话和发送短信。这些小盒子放在商场、写字楼等公共空间内,可以在个体毫不知情的情况下搜取个人数据,甚至包括婚姻、教育、收入等信息。


大数据时代的爱与怕



2019年3月18日,美团和饿了么被曝疑似窃听用户日常对话。《IT时报》称,通过长达3个月的测验,他们发现,只要日常在对话中提到某款食品的名字,这些外卖软件总能即时推送相应商家信息,出现相关推荐概率高达60%-70%。

伴随大数据时代的到来的,是信息安全这一新问题。过去几年里,从小平台到大公司,数据泄露事件频发,仅2018年就包括:圆通的10亿条快递信息在暗网上架出售;华住酒店、万豪酒店各有5亿用户信息外泄;国泰航空940万乘客数据流出;陌陌3000万用户数据泄露……

几乎按月爆发的频率、动辄上亿的量级面前,普通人兴许躲过这一劫,旋即栽在下一劫。

02

一位网络信息安全公司创始人曾向AI财经社讲述其团队习惯:全公司没有一个人使用真名收取快递及外卖;为了避免黑客撞库,他从不将同一个密码使用在两个地方。他们比大众更清楚,在互联网上,也许你早已是“裸奔”状态。

今天的流量早已不止是PV、UV这样的概念,流量有了姓氏、性别,喜好。比你更了解你自己的,可能是手机,更不用说各种实名认证的应用,轻松愉快间就让你成为都市里行走的透明人、互联网时代的楚门。

琐碎的个体信息背后,是潜在的商业价值。2015至2018年期间,由于代表着未来更多可能,大数据曾一度成为市场上时髦标签。包括国内许多创业者对外高频语述之一也是:“不要说我们是互联网公司,我们是技术驱动的大数据公司!”

平台以用户基本信息为基础,分析日常使用行为,提取个体特征,滚雪球般积累起10的N次方数据。这些数据,不但成为平台将业务进一步铺开的助推燃料,也成为换取资本青睐的筹码。

2018年3月,中国发展高层论坛年会上,百度董事长李彦宏说了一句充满互联网现实主义但注定惹火烧身的话:“中国人更加开放,对隐私问题没有那么敏感,很多情况下他们愿意用隐私交换便利性,那我们就可以用数据做一些事情。”

这句话实际抛出了一个问题:在获取便利和交出隐私之间,合适的度在哪里?

业界公认的是,即便用户不重视甚至放弃数据主权,这也不能成为隐私可以被平台随意使用的理由。为了规避风险,“授权协议”无处不在。安装一款新应用,是否同意读取存储权限和联系人信息?不同意,好的,那么您将无法使用该产品;购物App送您10元无门槛代金券,是否点击领取?点击即意味着你默认接受向该平台第三方提供小额贷款协议。

平台看似充分尊重用户的自由意志,实际操作中几乎是别无选择;鲜有人会把一屏屏授权协议耐心读完,更不会注意到满坑满谷的信息陷阱。有律师向AI财经社总结,这无异于“形式上的保护和事实上的侵犯”。

(编辑:温州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读