“Adaptive and Explainable Margin Trading via Large Language Models on Portfolio Management”
投资组合管理需监控市场动态,调整资金在多资产间分配,以实现盈利和稳定性。现有投资组合管理策略缺乏灵活性,无法在交易期间调整多空头寸,限制了风险管理和机会把握。
本文提出一种自适应和可解释的框架,将大型语言模型(LLMs)与强化学习(RL)结合,实现动态资金转移以应对市场变化。框架灵活适应多种外部数据源,包括微观和宏观经济数据、时间序列和新闻文本。实验结果显示,该框架的回报是基准的三倍,夏普比率翻倍。
【 扫描文末二维码加入星球获取论文,源码 】
摘要
简介
投资组合管理需监控市场动态,调整资金在多资产间分配,以实现盈利和稳定性。长仓和短仓的动态调整对利润和风险管理至关重要,尤其在波动市场中。现有策略多假设短仓与长仓的比例固定,缺乏灵活性,难以适应快速变化的市场环境。
大型语言模型(如GPT-4和Claude-3)提升了金融领域的数据分析能力,能处理非结构化数据,增强透明度和信任。LLMs通过零-shot学习适应新任务,推动数据驱动的金融策略发展。
本文提出一种自适应和可解释的框架,将大型语言模型(LLMs)与强化学习(RL)结合,实现动态资金转移以应对市场变化。框架包括两个阶段:市场预测/推理管道和头寸重新分配,定期调整投资组合。利用微观经济公司新闻和宏观经济指标时间序列进行市场趋势预测,提供透明的推理路径。在2020年5月至2024年4月的道琼斯工业平均指数(DJIA)上进行测试,结果显示LLM的介入显著提升了收益和风险平衡。
相关工作
预备知识
保证金交易允许交易者借款进行金融资产交易,利用杠杆放大收益。
长仓:预期资产价格上涨,价格上涨时获利。
短仓:预期资产价格下跌,价格下跌时获利。
盈利时,交易者的购买力增加;亏损时,购买力减少。长短仓均伴随高风险,损失可能超过初始投资。经纪商要求维持最低保证金水平(通常为持仓市值的40%),低于该水平会发出追加保证金通知。
边际交易可建模为强化学习中的马尔可夫决策过程(MDP)。代理在每个时间段观察当前状态,包括股权条件、收盘价、持股数量和技术指标。代理根据策略选择动作,动作为每只股票的买卖数量,正值表示买入,负值表示卖出。环境根据转移概率更新状态,代理获得反映即时收益的奖励。奖励设计考虑收益和风险,通常使用夏普比率作为风险调整回报指标。强化学习代理的目标是学习最优策略,以最大化期望累积奖励。
基于现有的RL模型Margin Trader,提出了一种新的投资组合管理方法。初始化时,代理以资本??开始,设置比例??决定长仓和短仓的资金分配。长仓资金为????=????,短仓资金为????=??(1???)。交易期间,长短仓的比例????会随市场波动而变化,但资金分配在长短仓之间保持固定。头寸权益包括股票和现金,未投资资金可能存在。在牛市中,调整长短仓比例而非持有未投资现金更具盈利潜力。根据市场条件和个股价格波动,调整长短仓比例和管理未投资现金对优化投资组合表现至关重要。
方法
设计了一个可解释的市场推理管道,通过大型语言模型(LLM)处理两种不同的数据集,生成相关洞察。针对每种数据集,定制了不同的提示管道,利用LLM分析、总结和解释金融市场数据。LLM预测未来六个月的市场趋势,分为七个细分类别(从强烈看涨到强烈看跌),以便后续的强化学习算法调整。
LLM响应映射到市场趋势评分。将情感水平转化为量化的市场趋势评分,正值表示看涨,负值表示看跌,零表示平稳。调整比例通过缩放因子控制,精确调整基于市场趋势预测的头寸变化。
实验
研究使用道琼斯工业平均指数(DJIA)作为投资组合池,测试期为2020年5月至2024年2月,涵盖复杂经济波动。数据来源于Yahoo Finance,包含公司价格数据。
外部数据源包括:
宏观经济指标时间序列数据,涵盖21个关键美国经济指标,数据来自美国通胀计算器和圣路易斯联邦储备银行,已调整为月频。
微观经济公司特定新闻数据,涵盖DJIA 30家公司,数据来源于Stock News API,包含公司公告、财报等,来源包括CNBC、路透社等。
为了公平比较投资组合表现,采用两个基准:DJIA指数和无LLM干预的Margin Trader模型。集成了两种金融NLP模型和多种先进LLM以评估框架:
FinBERT:基于BERT的金融情感分析模型。
FinGPT v3.3:基于LLaMA2-13B,专注于金融情感数据集。
GPT-4o:擅长多语言理解、问答、数学、代码评估等。
Claude-3.5 Sonnet:在多项评估中超越前代和竞争模型。
DeepSeek-V2:高效的Mixture-of-Experts模型,经济训练和推理。
Mixtral 8x22B:使用稀疏Mixture-of-Experts架构,降低计算成本。
LLaMA-3 70B:最新LLaMA系列,增强复杂NLP任务的理解和效率。
Qwen-2 72B:Qwen系列顶尖模型,处理复杂应用。
Yi 34B:在英中基准上表现优异,采用Grouped-Query Attention架构。
Phi-3 Medium:通过监督微调和偏好优化对齐人类偏好和安全性。
评估指标
评估投资组合管理的主要指标有两种:利润指标和风险调整指标。
利润指标:累计回报(AR)衡量投资组合在特定时期的绝对表现。
风险调整指标:
夏普比率(SR)评估每单位风险的超额回报,值越高表示回报越好。
卡尔玛比率(CR)比较回报与最大回撤,值越高表示在减少重大损失的同时能产生更高回报。
LLM集成框架在季度基础上表现优于DJIA和Margin Trader,显示出其有效的市场趋势检测和仓位比率确定能力。GPT-4o、Claude-3.5 Sonnet和Qwen2 72B的回报率超过两到三倍,Sharpe比率高出25%,Calmar比率也显著提升,表现突出;而FinBERT和FinGPT表现不佳,后者输出混乱,缺乏泛化能力。
将缩放因子从10%提高到20%通常提升模型表现,但也增加风险和波动性,可能导致在意外市场条件下的重大损失。模型在宏观指标上的表现普遍优于公司新闻,因宏观指标提供更广泛的经济信息;GPT-4o在公司新闻解读上表现突出。框架允许交易者选择数据源进行比率调整,确保在某些数据源不可用时仍能做出明智决策。图5展示了GPT-4o的市场趋势预测与DJIA实际走势的对比,预测与市场趋势高度一致。
总结
我们致力于人工智能、量化交易领域前沿研究,分享前沿论文、模型代码、策略实现。如有相关需求,请私信与我们联系。
请加微信“LingDuTech163”,或公众号后台私信“联系方式”。
关注【灵度智能】公众号,获取更多AI资讯。