人工智能和机器学习社交媒体数据为对冲基金提供了竞争优势

作者:亢溘

从一个数据世界中提取价值,分析公司名称(股票)或其他任何事物(宏观)的情绪,是一个复杂的旅程,我们只有5%左右这条道路参数不断发展,不断扩大的数据集,包括Twitter,图片,文字,视频等处理;依靠专家与人群的智慧; 12月6日至7日在纽约举行的资本市场会议上,新闻周刊将在人力资源市场会议上主持人工智能与数据科学会议:新闻周刊,上周的联通会议,人工智能,机器学习和情感应用于财务的分析(7月14日)汇集了该地区的一组专家,OptiRisk Systems教授介绍了Elijah DePalma和汤森路透的James Cantarella; Pierce Crosby,StockTwits; Anders Bally,Sentifi; Peter Hafez,RavenPack;斯蒂芬莫尔斯,推特DePalma与其他人有所不同,因为汤森路透情绪引擎只使用经认可的路透社新闻数据,而不是原始的社交媒体喋喋不休DePalma解释说:“当我们提取功能时,通常在学术文​​献上做的更简单的方法是'包词'方法我们正在做的事情有点复杂;我们正在进行语言解析,你正在研究语言的结构 - 所以你可以认为对象,动词,主题类型表示“这个例子在行动可能是句子:“IBM超越微软”一个简单的词汇方法将给予IBM和微软同样的情绪评分DePalma的新闻分析引擎认可“IBM”是主题,“微软”是对象并且“超越”如主语和客体之间的动词和正/负关系,情绪分数反映出来:IBM积极,微软,否定“所以你正在创建一个语法分析树和一个这样做的好处是,当你创建这些语法分析树时,你有一个低维特征表示,而不是你可能拥有成千上万个特征的单词。这使得最后一步 - 分类 - 更快“但它也使得情绪评分准确度提高了约20%;从60%的准确率到80%请记住,在人类读者中,内部准确度一致性约为85%“DePalma指出解析方法也会影响路透社接近外语的方式,就像其日本新闻分析服务一样”为什么不采用谷歌翻译等自动翻译引擎,将日语翻译成英语并应用你的引擎?因为我们会丢失语言结构并且基本上简化为一堆词语类型的准确性“Twitter的数据的非结构化”嘈杂“特征并没有阻止大型对冲基金和资产管理人员分析它以试图获得优于竞争对手的优势Twitter的数据合作伙伴和销售高级经理斯蒂芬莫尔斯说:“我们的金融领域正在快速增长。我们直接为对冲基金,交易商,做市商,银行,金融科技合作伙伴等提供服务”我们不是新闻组织,但事件现在在Twitter上非常普遍 - 不仅围绕重大的金融事件而且是上帝事件的行为所以这是金融市场的一个大用例,情绪分析是一个非常常见的用例,我们在'cashtag'看到了“在他们做任何其他事情之前,许多首席执行官开始在Twitter上进行沟通,比如Elon Musk如果你想知道他在做什么你必须去Twitter - 这是他将要去的第一个地方,通常是只有他传达的地方“莫尔斯说,消费者对某些品牌产生的情绪,这也会影响股票价格,这是目前正在探索的主题的一个新的转折,我们可以期待看到很多未来Twitter也可以衡量宏观他说,并且去年的一项研究表明Twitter的数据可以预测美国StockTwits的失业率水平,该数据提供了对各个公司的实时评论,是推特采用的现金标签的发明者,随着时间推移,皮尔斯克罗斯比,业务总监和数据传播者,StockTwits说:“基本上我们所有的对话都围绕着各个公司构建。但我们也允许用户添加二进制文件,因此他们在他们的消息中添加了一个看涨或看跌的标签 “从数据库的角度来看,它成为大型数据库的分类器,因为你有这些二进制文件可以消除很多误报,或者像人们试图用他们的语言搞笑一样的东西克罗斯比说,虽然情绪显然是低悬的水果,这些数据也可以用来调查股票的波动性“我认为在宏观层面它真的很有意思,但在公司层面和行业层面上它也很有意思,我们或多或少看到交易量实时飙升不同的资产类别或公司或ETF,并且实际上转化为已实现的波动性“我们开展的研究实际上关注的是人群的预测因素,不仅仅是事件,而是日常交易活动所以基本上试图将波动率关联起来它适用于社交数据公司正在成为人们真正感兴趣的领域“首席数据科学家Peter Hafez,RavenPack说现在的一个重要概念是”演示cratising数据“大型对冲基金和资产管理公司希望知道他们可以在需要时获得他们所需的数据,无论是内部还是外部。他说:”我们可以生产大量新数据。利用这一点,许多资产管理公司和对冲基金已成为一些数据囤积者“数据可以是任何东西,从电子邮件到即时消息或法律文件这些可以通过他公司的数据引擎提供给人们,这是比如访问私有云“最终人们试图建立的内容几乎就像是亚马逊的内部,你可以在平台上说,我想找回我们所知道的关于IBM的公司”然后你“从法律部门获得,我们知道道琼斯新闻网,我们从Twitter知道这一点,我们知道从我们收件箱中的分析报告中你可以拿走所有这些不同来源并将其结合起来“ DePalma补充说:“在过去的五六个月里,我有过一些不满对大型基金经理进行的试验 - 大量超过数千亿资产管理公司“其中一位透明地告诉我,他们相信这些行为融资工具将在未来五到十年内成熟,他们和他们的投资组合经理一样,已经将这些类型的信号纳入自由裁量程序“因此,随着这些工具变得更加可靠和成熟,他们的投资组合经理将已将其纳入其中,....