科技创新服务是迭代最快的领域,数据科学会创造一个分工更明确的社会。
在科技巨头公司已经领导开发大数据算法、人工智能技术的时候,我们依然可以看到科技独角兽公司层出不穷。
今天,科技前哨要与你分享的是大数据分析预警公司Dataminr创建于2009年,主要帮助商业机构和政府组织从社交媒体中提取他们想要的信息,并预测后续发展,帮助识别假消息,找到可能的舆论风险,甚至能帮你发现投资机会,
如今,从政府部门到全球组织、从跨国公司到新闻传播集团,全球100多个国家和地区的各种组织都依赖于Dataminr的实时信息技术。根据今年3月弗雷斯特市场咨询(Forrester Consulting) 发布的研究显示,借助Dataminr的服务,企业可以有效避免业务安全问题,其客户可以在三年内实现421%的投资回报率,投资回报周期不到6个月。
1. 泰德·贝利与Dataminr
创始人泰德·贝利(Ted·BAIley)大学时就对信息技术传播产生了浓厚的兴趣,他研究了实时信息技术历史,惊叹于电报、广播以及电视等信息技术对社会的改变。
9/11事件深刻的冲击了泰德·贝利,技术缺口导致了巨大的实时信息差,世贸中心2号楼倒塌时1号楼内的人员并没有及时得知外面发生的一切,错过了最佳逃生时机。
他意识到如果有一项技术可以供人们实时取得关键信息,弥补信息差,在危险到来的时刻发出警报,也许就可以避免像9/11这样的悲剧再次发生。
2009年6月1日,世界上第一个实时信息监控平台Dataminr在美国创立。
就如它名字一样,Dataminr是数据淘金者。泰德·贝利的实时信息技术被用于挖掘公开数据并进行风险检测,他也被公认为实时信息监控技术的领导者。
2. Dataminr的核心技术
如果要做比喻的话,Dataminr就是21世纪的“地动仪”。
Dataminr的强大算法能将社交平台上的数十亿个公开数据转变成实时的消息警告,全天候的检测实时信息流,使世界各地的安全、运营、财务和通信专业人员能够随着事态的发展而获取必要信息。该公司就曾根据推文在恐怖组织(ISIS)正式公开信息前预测舆论传播与石油价格的联系。
众所周知,社交媒体平台的内容大多都是文本、图像、视频、音频的结合产物,格式多样且呈现出碎片化的特征,算法处理过程中难免会出现遗漏、重复和误判。
Dataminr的首席科学家和AI高级副总裁亚历克斯·海梅斯(Alex Jaimes)解释了Dataminr的一项核心技术——多模态AI融合模型。
这套模型结合人工智能领域的图像识别、语义理解等技术,会对给定的文本、图像等进行交叉关联的深度学习。
也就是说,在分析图文内容时,AI会整合多条消息中相似的内容,利用当下最火热的注意力机制,交叉对比图文内容,这个机制显著的提高了检测的准确性。
我们在公众号文稿里放上了它的技术细节展示,你有空的话可以打开看一看。
简单说,一条社交媒体的消息会被拆分为图像和文本分别进入各自的流程中提取信息,由不同的AI分别从图像和文本提取关键信息进行交叉分析。
最后通过随机共享模型(SSE),一种能为不同关键词提供个性化分析的人工智能框架,提高分析的精度,避免过度拟合。
这个交叉分析加随机共享模型的大框架,就是多模态AI融合模型的核心,有了这个框架不但可以用来比较图文,视频、音频都能让AI进行独立检测。
例如,当AI在社交媒体信息中发现了一条飞机事故的信息线索后,并不会立刻给出警报,只有当事故附近的目击者上传现场照片时,有足够多的证据进入模型,才会给出飞机失事的警报。
相比于传统的AI,这套多模态融合模型并不会因为一两条“假消息”就发出警报,而是根据文字、图片、视频、音频乃至定位做出综合判断,当关键词都指向危险时,它就会立刻提醒相关用户,减少假预警,也让判断的依据更好理解。
3. 加速拓展业务
2014年时,美国有线电视新闻网(CNN)、推特(Twitter)联合Dataminr,打造了新闻线索发掘工具Dataminr For News,该工具每天可实时搜索数亿条推文,追踪照片或视频的原始来源,分析新闻线索的价值,帮助记者快捷地找到突发新闻和有价值的新闻。
泰德·贝利曾说:“新闻挖掘(DataminrForNews)将分析推文以发现和揭示重大新闻,而这个技术仍处于萌芽阶段。”
如今Dataminr被估值为41亿美元,是纽约顶级私营科技公司之一,连续五年入选福布斯云100强,并于2019年被评为福布斯人工智能最具潜力的50家公司。
随着世界公共数字数据的指数级增长,Dataminr代表了实时信息技术历史上的重大飞跃——与电报、广播和电视技术一样重要。2021年,Dataminr的业务逐渐扩展到全球各地的组织,这也从根本上改变了21世纪数据和实时信息的运作方式。
4. 对初创者的启示
如果从高处俯瞰科技企业的发展,你会看到科技创业的两条路径,一种是“从大到强”利用新技术快速打开市场,再不断引入其他技术增强实力;另一种是“从强到大”,利用新技术在一个领域深耕,从垂直技术工具逐步拓宽覆盖面,一步步将技术实力转化为市场优势。
Dataminr就是后者的一个代表,先开发核心技术、创建数据分析模型,进一步发展业务。目前不少AI企业都在尝试这条发展道路,Iris AI在科研领域、Deep Genomics在生物领域、Cloudmoyo在云服务领域,都在从一个业务发起,逐步扩张。
在AI+大数据的应用上,初创公司仍有大把的机会,只要你发现了一个行业中的缺口,寻找到满足该需求的技术方案,一个初具雏形的公司就诞生了。
当然这类科技初创公司的前期一定是艰苦而缓慢的,需要在技术上持续深耕,在服务上打造差异化的体验。
你有思考过自己熟知的领域的技术缺口吗?如果让你做选择,你会选择科技巨头已经搭建好的模型,还是自行克服技术问题以建成核心技术模型呢?