问 题

华尔街的高频交易系统为例,称70%的股票交易由计算机算法完成
2015-06-15_gpjy

部分回答

“高频交易”是一个挺差劲的名字。按照字面意思,任何能够以较高频率进行交易的系统都可以叫“高频交易系统”。比如说你用VBA写个小程序,连上券商给你的接口,也完全可以按毫秒级进行交易,你也可以说自己开发了一个“高频交易系统”。

不过,按照现在市面上的主流认知,我想大多数人概念里的高频交易系统是这样的:

  • 交易指令完全由电脑发送,对市场数据的响应延时在微秒级(VBA退散)。
  • 系统由专用的软硬件组成,研发时需要大量计算机专家级的工作(散户随便编个小程序退散)。
  • 系统的硬件需要放在离交易所主机很近的位置上,所谓 co-location。并且得到专门的准入许可证,交易指令直接发送至交易所(而不是通过券商中转)。

符合这三点的,就可以叫做高频交易系统。有人说你这三条没有一条在说频率,只能叫低延迟系统不叫高频交易。的确,我再一次深切赞同“高频交易”是一个很差劲的名字。但现在市面上的主流媒体,包括大部分新闻和畅销书在谈到这个话题时,说的就是这种系统,所以我在这里就不纠结字面意思了。

如果对我上面给出的描述仍有疑问,那么事实上还有一个非常官方的定义,来自美国证券交易委员会(SEC)。SEC 也很难给出明确的定义,最终的描述是基于5个特性:

  • 使用超高速的复杂计算机系统下单
  • 使用 co-location 和直连交易所的数据通道
  • 平均每次持仓时间极短
  • 大量发送和取消委托订单
  • 收盘时基本保持平仓(不持仓过夜)

高频交易的盈利能力很高吗?
现实很残酷。和任何其他行业一样,赚大钱的的确有,赔钱的也大把存在。我想这个行业特别吸引眼球的原因主要是因为它融合了金融和计算机这两个热门词汇,而且确实是一个高科技行业(相信没几个行业会关心光速在不同介质中的区别),很容易给外人一种神秘感。但如果只盯着金字塔顶端的几家公司而下结论,就好像看了乔丹集锦以后就认为所有打篮球的人都能扣篮一样,是不现实的。

特别需要说明的是,因为高频交易系统对低延迟的敏感性,研发时需要投入大量的人力物力,要高薪聘专业的计算机专家,花钱买昂贵的硬件,租用专门的微波通信线路。但这一切也不能保证你得到一个预想中的“低延迟”系统。整个系统的设计和开发是一个非常复杂的工程。而且交易系统对于准确性和稳定性要求极高,不够精密的话上线后会出现各种问题,根本无法使用。

我来说说,说得不对的地方,大伙就当扯淡吧。。。

交易就家庭聚餐的时候吃最后的甜点。。。妈妈把蛋糕从厨房拿出来递给了老大。。。你从老大手里接过蛋糕,自己切一块,然后递给下面的人。。。

注意啦,在这每次传递的过程中,总有一些面包屑掉了下来。这些面包屑就是arbitrage。有一些机构就是靠这些面包屑活下来的,他们就生活在你和你的兄弟交盘的一瞬间,把这些arbitrage给吃掉了。

高频就是在收集这些面包屑啊,他和别的交易方法大同小异,就是速度快了点。一般来说是1秒以下吧,基本上是按几到几百毫秒计算吧。当然,现在也有人搞微秒级别的,那是超高频,拼的完全是硬件和网络。也就说在高频交易里,你买卖的时间很短,量很小,频率很高,所以叫高频啊。

这些arbitrage有的是真的套利,就是你捡的时候,确认是真正的面包屑,而不是地上的老鼠屎。大多数情况下只是在统计意义下面的套利,就是收益的分布对你有很有利,有很好的risk-reward。简单说是面包屑比老鼠屎多得多。这也说明了高频的意义所在。学统计的都知道,没有大量的试验,统计性是没有意义的。

具体的方法和策略当然有很多,大都需要统计分析的支持。简单的可以是基于TA,甚至某个指标。可以是pair-trading,stock vs index。复杂的可以是cross market,比如股票和股权,bond和cds,甚至是cross exchange,black pool的。就是哪有面包屑,就往那里凑热闹。一般来说,market越新越好的哦。

技术上面,概率统计和随机过程很重要。机器学习,模式识别,信号处理的武器也经常要用到。数据和软硬件也很重要,大都是需要用C++实现,也有人用python,matlab等scripting写程序。。。

当然,做高频交易大都是机构搞,最著名的就是那个Simons的Renaissance Fund。老James可是高微分几何出身的,呵呵。自己也可以玩玩,但是对技术要求比较高的哦。