搜索引擎的大数据背后,是一个个的数据金矿

一个人的搜索习惯从长期累计看可以用行为学理论得到很多个人信息,而在海量的搜索行为背后就会有更多可挖掘的内容,有极其宝贵的作用

搜索引擎的大数据背后,是一个个的数据金矿

google对于我们来说并不陌生,有什么问题都可以在google里面进行搜索,他给我们的生活带来了很多的帮助,是我们生活学习工作中必不可少的一个有力助手。那么google 牛在哪里?搜索业务背后蕴藏着巨大的金矿

简单来说,一个人的搜索习惯从长期累计看可以用行为学理论得到很多个人信息,而在海量的搜索行为背后就会有更多可挖掘的内容,这个无论对于企业还是政府而言都有极其宝贵的作用。

抽象来说,一个搜索行为同样是一种反馈意见,海量的搜索行为将会形成巨大的“民意”,或者说会有巨大的统计价值。好几年前,我和朋友讨论过此事,友人说 Google 背后的确有团队在做这样的事,但因为涉及个人隐私因此一直没有商业化,我当时甚是不以为然,绕开隐私的方式有很多种,Google 也许会将此金矿挖掘并打开搜索的另一扇盈利之门。

时间到了2008年。当时正值金融危机,股市低迷,在一次饭局中跟一位在全国最大营业部做投资顾问的哥们闲聊,他说了一个现象:“ 散户们很白痴。07 年 6000 多点的时候我们营业部人满为患,像个菜市场,一个新丁客户经理一天开 5 到 6 个户那都是少的,但现在呢,市场跌到 1800 点,我们那么大的营业部都门可罗雀,就凭这一点就可分辨行情了,人多了是顶,人少了是底。”

哥们一番乱语,却让我颇受触动:这就是草根行为分析啊,营业部既然那么大,应该是可以说是市场的一个缩影,也许应该开发客户数据做一个统计分析,比如交易数据,持仓数据等,内部可以作为行情的量化参考,把草根的感受用标准量来衡量,这样可能更为精确。

哥们当时也觉得是一途径,大有觉得守着金矿找金矿的感觉。后来,再遇见他时,他很遗憾得告诉我说,老总没同意,说怕涉及客户隐私,并且作为营业部也没有这样做模型开发的人,于是作罢,我一声叹息。

时值今日,这个模式依然有前景,而且金融工程的牛人大有人在,无论是舆情分析还是情绪模型都有一定的起色,只是庞大的数据还在深山中。 话再说回来,google 不开发这个业务,放弃练盖世的“葵花宝典”,不等于说世上就没人练“辟邪剑法”了。国内,就有拓而思和秒针。

前者,是专门基于搜索源吃饭的软件公司,说白了就是给政府和企业做舆情监测和分析的。典型案例是百威啤酒,以前是用公关公司做舆情分析,每个月费用 2 万,现在改用这个软件,每个月费用 5 万。但为什么还用它?无非是它快速准确及时,以前公关公司雇佣人在百度、Google 上搜索了舆情然后再进行归纳分析和总结,但限于这些搜索引擎的限制,特别是没办法按照时间节点来判断,要人工操作,因此很费时,往往要一个月时间用十个人来办,但现在依靠这个软件一个人一个小时就搞定了。因此这样的公司在基于搜索源的这块天地里创出了一片天。

后者,在数字广告效果评估领域耕耘,通过到达率 (reach)、有效频次(frequency)、互联网毛评点(iGRP,internet gross rating point)、受众特征等维度,评估在线广告接触效果,以帮助品牌主提高媒介投资的 ROI 。近日,它也获得风险投资机构凯鹏华盈领投,宽带资本 、红点资本和 WPP Digital 共同参与的 2000 万美元融资。KPCB 合伙人周炜谈及此次投资时特别提到了“通过海量数据收集处理运算及独特技术”的“成长潜力和竞争优势”。说白了,风投看好该企业对广告数据源的开发。

大家都说好,似乎都看到了数据源业务的潜力,吾等局外人不禁要问 ,位居搜索老大,Google 为什么还不发力呢?用户隐私还是它无法自宫的理由否?如果发力,类似本篇所述企业之流是不是就没机会了呢?还是仍有蓝海之域?

这些问题如果还算初级的话,那么对于 Google 而言还有一个更为严峻的问题,那就是 Facebook 或者微博的崛起已经让 Google 的搜索数据金矿有点掉价,因为社交网络背后的数据源可能更为有效,显而易见的一点是社交网络是有连线的数据源,很容易分类或者定位,比之无分类的一般搜索,在此基础上建立统计分析要准确和简单得多。

君不见英国已经有基于 Twitter 情绪指数成立了 Twitter 情绪指数的对冲基金,其背后的原理也是对 Twitter 相关数据进行统计继而建立模型。

设想一下吧,如果 Facebook 或者微博发力进入这个数据源领域,版图又会怎么样,是另一场革命吗?一切都还没有答案。

本文来自投稿,不代表【】观点,发布者:【

本文地址: ,如若转载,请注明出处!

举报投诉邮箱:253000106@qq.com

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2024年5月1日 10:03:24
下一篇 2024年5月1日 10:05:31

相关推荐

  • java二维数组获得数据,java二维数组用法

    java中怎样用一位数组获得二维数组中某一行的值 利用 for循环遍历数组 即可 for循环是开界的。 Number : Name : A : B : Value;通过读取指定的列名,你可以得到,列名在数组中对应的索引值。 其实多维数组是在一维数组的基础上进行变换的,就拿二维数组来说,它是在一维数组上存储一维数组。 得到一维数组的长度lenth,如果长度为8…

    2024年5月23日
    3700
  • excel中逐个叠加数值,excel数据叠加

    Excel表中如何将一列的数值全部加上一个数值,并且覆盖原有的数值呢? 1、打开EXCEL表格,在其中一个单元格输入要“加”的数值,复制。选择单元格中要“加”的数据,点击“粘贴”–选择性粘贴—加,即可。 2、假设一个表格(如图一),将A列的数值分别加上5,然后在B列中快速获得所要的相加结果。 3、EXCEL给每列数值增加一个固定的数值…

    2024年5月23日
    5300
  • java将数据分类存进二维数组,java将二维数组保存在文件

    java怎么从mysql查询出来的结果转化为二维数组,举个例子 把你二维数组中的所有数据拼接起来,用“,”连接,组成一个长的字符串,存入数据库。进行其他操作时,可先将该字符串解析,原理和普通的字符串是一样的。 –这儿存在两种情况:字符串不存在分隔符号 字符串中存在分隔符号,跳出while循环后,@location为0,那默认为字符串后边有一个分隔…

    2024年5月23日
    3600
  • excel重复输入提醒,表格数据输入重复怎么提醒

    怎样设置excel,使得同一列输入数字重复时,显示提示 1、在 Excel 菜单栏上选择“开始”选项卡,然后单击“条件格式”。在条件格式下拉菜单中选择“突出显示单元格规则”,然后选择“数值”。在数值下拉菜单中选择“重复值”。 2、开启EXCEL表格,选择整列单元格,点选“开始”–条件格式–突出显示单元格规则。选择”重复值“设定突出显示…

    2024年5月23日
    4500
  • java动态生成复选框,java复选框如何回显数据

    如何用javaScript实现复选框的联动? 很简单,给表格一个ID,ID=form1,再给个参数sty;e=display:none;然后JavaScript写 function open(){document.getElementById(form1).style.display=block} 在按钮上写JavaScript:open();好了,试试看。…

    2024年5月23日
    3400
  • excel怎么回归分析数据,excel中怎么进行回归分析

    Excel怎样做回归分析呢? 1、点击文件 点击左上角的【文件】。点击选项 点击左下角的【选项】。点击加载项 弹出Excel选项窗口框,点击左边的【加载项】。点击分析工具库 点击右边的【分析工具库】。点击转到 点击下面的【转到】。 2、方法如下:选择成对的数据列,将使用“X、Y散点图”制成散点图。在数据点上单击右键,选择“添加趋势线”-“线性”,并在选项标签…

    2024年5月22日
    3900
  • excel不统计重复数据,excel 统计不重复数据

    Excel如何不用公式统计不重复的数据个数?Excel不用公式统计不重复的数… 1、首先选中Excel表格,双击打开。然后在该界面中,选中要显示不重复的公司数量的单元格。再者在该界面中,公示框中输入统计不计重复的公司数量的公式“=SUMPRODUCT(1/COUNTIF(A1:A6,A1:A6))”。 2、示例公式:=SUM(N(MATCH(IF…

    2024年5月22日
    5300
  • excel随机组合词语,数据随机组合

    EXCEL如何从10个词语中,随机选出3个,组合不重复。 1、=RANK(A1,$A$1:$A$10) 下拉到B3 B1:B3就是1-10随机抽取的三个数 每按一次F9,会在B1:B3得到1-10随机抽取的不重复的三个数 再用index函数,可实现数字到名字的对应。 2、首先选定A1到A10,输入等号rand按Ctrl加Enter,在B1输入公式等号RANK…

    2024年5月22日
    3900
  • excel中部分数据,excel中部分数据更新后如何快速放回原表?

    如何选excel中一列数据的一部分 1、提取第一个单元格数字在excel表格中,手动提取第一个单元格数字。点击下一个单元格鼠标点击提取数字的下一个单元格。按Ctrl+E提取使用快捷键Ctrl+E智能提取下面的数字。 2、打开Excel文件,选中待处理的数据区域,然后分别点击菜单开始–条件格式–突出显示单元格规则–重复值。确…

    2024年5月22日
    4100
  • java高并发共享数据库,java 数据共享

    用java做互联网开发,高并发,大数据量,应具备哪些技术?系统架构,数据库… Java开发需要掌握以下技术:掌握Java语言的使用:语言语法、程序逻辑,OOP(面向对象)思想,封装、继承、多态,集合框架、泛型、File I\O技术,多线程技术、socket网络编程,XML技术。 主要是能够为云构建的分布式RESTful搜索引擎。Elasticse…

    2024年5月22日
    4000

发表回复

登录后才能评论



关注微信