量化投资、人工智能、深度学习
https://www.idea.edu.cn/guojian/
现任IDEA研究院(署理)院长、AI金融首席科学家,并兼任香港科技大学(广州)人工智能学域兼职教授(博导)、上海交通大学(上海高级金融学院)兼聘教授、清华大学(深圳国际研究生院)实践教授和华南理工大学的兼职教授(博导)。郭健教授是IDEA研究院创始成员之一,回国之前曾任教于美国哈佛大学(Tenure-track),是数据科学与机器学方面的专家。其研究领域包括: AI量化投资技术、深度学习与强化学习、金融知识图谱推理等。郭健也是人工智能金融投资领域的长期实践者和创业者。
多模态大语言模型的快速发展证明了利用海量样本预训练的深度学习底座模型在经过增量微调或强化学习后训练后在特定任务上展现出前所未有的性能。我们将这一范式移植到量化投资场景中的金融时间序列预测问题中,收集不同交易所(上交所、深交所、港交所、纽交所等)、不同交易品种(股票、期货、可转债等)和不同周期(订单簿、秒线、分钟线、日线等)的金融数据来训练通用的金融时间序列底座深度神经网络模型,并在各类型量化投资任务中进行增量微调或RL后训练以提升针对任务的预测能力。
深度神经网络端到端量化投资建模跨越因子挖掘、机器学习建模、投资组合优化、算法交易等多个步骤,从最原始的数据输入(行情、订单簿等)直接输出下一秒的订单交易指令,可以显著简化建模过程并提升交易性能。由于金融时序数据低信噪比、非平稳等特定,端到端建模存在神经网络收敛难、模型训练不稳定、模型推理延迟大等一系列问题亟待研究解决。我们研发了Guided Learning、鲁棒学习等一系列新技术来提升端到端量化投资模型的投资效果和稳定性。
Alpha-GPT是世界首个开放式人机交互式量化投研智能体系统,并随着大模型领域的快速发展而不断进化。通过Self-improving、rethink、强化学习后训练等技术来激发和提升大模型在量化因子挖掘、量化深度学习建模等能力。我们也从数学理论上给出了self-improving合理性的论证。
以多因子选股模型为代表的量化投资建模是一个多阶段决策问题,包括特征工程(因子挖掘)、模型构建(因子组合)、投资组合(仓位优化)、拆单执行(算法交易)等多个步骤,最后输出交易指令。Quant4.0的目的是通过人工智能技术实现量化投资建模全流程自动化,研发更高效的自动特征工程、自动化深度学习调优算法、自动化深度学习部署与推理加速等技术以提升投研效率,将量化投资从“人工建模”进化为“机器建模”。进一步,利用大语言模型提升自动化因子挖掘和自动化深度学习建模的智能水平。
量化投资通常利用历史数据回测模拟来评估策略、模型和因子的效果。然而,历史不代表未来,历史没有发生的极端行情不代表未来不会发生。我们研发“金融风洞”来模拟历史上尚未发生的各种极端行情,对交易策略进行压力测试。金融风洞项目研发生成式深度神经网络和多模态大模型,通过学习全球不同金融交易市场的行情数据和来自财经新闻、企业公告等金融事件,理解金融市场运行规律,并以此来根据用户需求来生成新的金融行情时间序列,对各种极端行情进行高精度模拟,建立比回测更准确更全面的策略评估体系。
我们提出语境图谱(Context Graph)技术。在传统三元组型知识图谱的基础上,进一步将时间、空间、来源、文本描述等多维上下文信息与实体及关系一并建模,以构建更为精细和丰富的知识表示结构。它不仅包含“头实体–关系–尾实体”的基本事实三元组,还为每条事实附加了实体上下文(如摘要、别名、图片链接)和关系上下文(如时间戳、地理位置、出处句子等),从而克服了纯三元组图在语义歧义、信息不完整和推理局限等方面的不足,可以更好的帮助大语言模型进行精准可追溯的深度推理。同时,我们正在研发全自动化的语境图谱构建技术。