• 签到
  • bob投注下载之家

    苹果/安卓/wp

  • Peixun.net

    苹果/安卓/wp

  • 客户端
  • 就业指导一对一
  • bob投注下载大学堂
  • 现金交易
  • 专家入驻
  • 求职招聘
  • 3关注
  • 35粉丝
  • 运营管理员

    院士

    28%

    还不是VIP/贵宾

    -

    威望
    3
    论坛币
    143656 个
    通用积分
    101.4860
    学术水平
    87 点
    热心指数
    96 点
    信用等级
    77 点
    经验
    54374 点
    帖子
    974
    精华
    7
    在线时间
    1188 小时
    注册时间
    2019-9-11
    最后登录
    2020-10-20

    签到天数: 2 天

    连续签到: 1 天

    [LV.1]初来乍到

    AIU人工智能学院 学生认证  发表于 2020-10-15 08:41:29 |显示全部楼层
    CDA人工智能学院致力于以优质的人工智能在线教育资源助力学员的DT职业梦想!课程内容涵盖数据分析机器学习深度学习人工智能tensorFlowPyTorch、知识图谱等众多核心技术及行业案例,让每一个学员都可以在线灵活学习,快速掌握AI时代的前沿技术。PS:私信我即可获取CDA会员1个月免费试听机会

    近些年,大数据已经和云计算一样,成为时代的话题。大数据是怎么产生的,商业机会在哪?研究机会在哪?这个概念孕育着一个怎样的未来?

    昨天在车库咖啡参加了一个小型的研讨活动,就这些问题进行了一些讨论,我结合自己的一些理解做一个总结。
       首先,大数据是怎么产生的?
        1)物理世界的信息大量数字化产生的
        例如刘江老师指出的好大夫网,将医生的信息,门诊的信息等数字化。其实还有很多,比如新浪微博将茶馆聊天的行为(弱关系产生信息数字化),朋友聊天的行为数字化(强关系产生信息数字化)。视频监控探头将图像数字化。
        2)社交网络产生的
        在雅虎时代,大量的都是读操作,只有雅虎的编辑做一些写操作的工作。进入web2.0时代,用户数大量增加,用户主动提交了自己的行为。进入了社交时代,移动时代。大量移动终端设备的出现,用户不仅主动提交自己的行为,还和自己的社交圈进行了实时的互动,因此数据大量的产生出来,并且具有了极其强烈的传播性。
        3)数据都要保存所产生的
        一位嘉宾指出,旧金山大桥保留了百年的历史数据,在时间跨度上产生了价值,很多网站在早期对数据的重视程度不够,保存数据的代价很大,存储设备的价格昂贵,但是时代变了,存储设备便宜了,用户自己产生的数据得到了重视,数据的价值被重视了。因此越来越多的数据被持续保存。
       其次,大数据和大规模数据的区别?
        big data之前学术界叫very large data,大数据和大规模数据的差距是什么?我认为在英文中large的含义只是体积上的,而big的含义还包含重量上的,价值量上的。因此我认为:
        1)大数据首先不是数量上的堆砌,而是具有很强的关联性结构性。
        比如有一种数据,记录了世界上每一颗大树每年长高的程度,这样的数据不具有价值,因为只是简单堆砌。
        如果数据变成,每一个大树记录它的,地点,气候条件,树种,树龄,周边动植物生态,每年长高的高度,那么这个数据就具有了结构性。具有结构性的数据首先具有极强的研究价值,其次极强的商业价值。
        在比如,淘宝的数据,如果只记录一个交易的买家,卖家,成交物品,价格等信息,那么这个商业价值就很有限。淘宝包含了,买家间的社交关系,购物前后的其他行为,那么这个数据将非常有价值。
        因此,只有立体的,结构性强的数据,才能叫大数据,才有价值,否则只能叫大规模数据。
        2)大数据的规模一定要大,而且比大规模数据的规模还要大。
        要做一些预测模型需要很多数据,训练语料,如果数据不够大,很多挖掘工作很难做,比如点击率预测。最直白的例子,如果你能知道一个用户的长期行踪数据,上网的行为,读操作和写操作。那么几乎可以对这个人进行非常精准的预测,各种推荐的工作都能做到很精准。  最后,大数据的机会在哪里?对小公司的机会在哪?
        围绕数据的整个产业链上,我认为具有以下机会:
        1)数据的获得
        大量数据的获得,这个机会基本属于新浪微博等这类大企业,大量交易数据的获得,也基本属于京东,淘宝这类企业。小企业基本没机会独立得到这些用户数据。
        2)数据的汇集
        例如如果你要能把各大厂商,各大微博,政府各个部门的数据汇集全,这个机会将是极大的。
        但,这个工作,做大了需要政府行为,做中档了,要企业间合作,做小了,也许就是一个联盟或者一个民间组织,比如中国爬盟。
        3)数据的存储
        汇集了数据后,立即遇到的问题就是存储,这个代价极大,原始数据不能删除,需要保留。因此提供存储设备的公司,执行存储这个角色的公司,都具有巨大的市场机会,但是这也不属于小公司,或者早期创业者。
        4)数据的运算
        在存储了数据以后,怎么把数据分发是个大问题,各种API,各种开放平台,都是将这些数据发射出去,提供后续的挖掘和分析工作,这个也需要有大资本投入,也不适合小公司。
        5)数据的挖掘和分析
        数据需要做增值服务,否则数据就没有价值,big也big不到哪里去,是没有价值的big.因此这种数据分析和挖掘工作具有巨大的价值,这个机会属于小公司,小团体。
        6)数据的使用和消费
        在数据做到了很好的挖掘和分析后,需要把这些结果应用在一个具体的场合上,来获得回报,做数据挖掘和分析的公司,必须得找到这些金主才行,而这些金主肯定也不是小公司。
       大数据未来的形态,或者产业链结构一定是分层的,巨大的,价值的体现发生在各个层次,每个层次都是生态链的重要一环,都孕育着巨大的机遇和挑战,我们能做的唯有努力,做适合自己的工作。

    0D04CBB8996CB009643B8D6FD844F0C0.jpg

    关注“CDA人工智能学院”,回复“录播”获取更多人工智能精选直播视频!




    CDA人工智能学院http://edu.cda.cn)专注于数据科学与人工智能技术的在线教育平台。内容涵盖数据分析、机器学习、深度学习、人工智能、TensorFlow、PyTorch、知识图谱等众多核心技术及其行业案例,自由灵活的在线学习方式,让每一个学员快速掌握AI时代最前沿的技术!
    返回列表 发帖 回复
    您需要登录后才可以回帖 登录 | 我要注册

    京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

    GMT+8, 2020-10-20 19:00