基于价格网络聚类优化的加密货币投资组合框架,平均预期回报高达486.21%

Optimising cryptocurrency portfolios through stable clustering of price correlation networks


自2009年比特币推出以来,加密货币逐渐被接受为独特资产类别。加密货币价格预测面临巨大挑战,因其波动性和不可预测性高于传统股票。


本文开发了一个技术框架,使用每日收盘价的历史数据,并集成网络分析,价格预测和投资组合理论来识别加密货币,以在不确定的情况下构建有利可图的投资组合。


投资组合实验表明,Baseline策略在投资期内有92.86%的概率获得正回报,而P(ARIMA)策略则为100%。P(ARIMA)策略在1天投资期内的平均预期回报为486.21%。



【 扫描文末二维码加入星球获取论文 


摘要


加密货币市场由于其不受监管的性质和固有的波动性,给投资带来了独特的挑战。然而,可以利用投资组合探索集体价格变动,以最小的风险实现利润最大化。本文开发了一个技术框架,使用每日收盘价的历史数据,并集成网络分析,价格预测和投资组合理论来识别加密货币,以在不确定的情况下构建有利可图的投资组合。5年的实证分析表明,尽管加密市场波动很大,但隐藏的价格模式可以有效地用于产生持续盈利的、与时间无关的加密货币投资组合。


简介


全球加密货币市场快速增长,重新塑造传统金融格局。自2009年比特币推出以来,加密货币逐渐被接受为独特资产类别。加密货币价格预测面临巨大挑战,因其波动性和不可预测性高于传统股票。研究表明,加密货币市场价格变化具有显著的随机性,传统预测模型在不同市场条件下表现不佳。


简单技术交易规则在市场泡沫期间未能提供额外收益,但有效降低了下行风险。投资者应采用适应性模型策略,结合机器学习与传统金融分析,以应对加密货币市场的快速价格变化。


投资组合管理在股票市场中通过多样化、资产配置、价值投资等策略来管理风险和实现投资目标。有效的投资组合管理结合财务分析、市场研究和风险管理,以优化回报。


算法交易和机器学习技术在加密货币投资组合管理中发挥了重要作用,利用算法分析大数据以识别盈利机会。强化学习算法能够在动态市场环境中学习最优交易策略。通过社交媒体和新闻情感分析,构建加密货币投资组合,获取市场情绪和投资者行为的洞察。采用机器学习技术,根据市场资本化、交易量和历史价格趋势对加密货币进行分类,识别市场模式。利用区块链分析评估链上数据,分析交易模式、钱包流动和代币流动,识别流动性模式和市场操纵。将分析整合到投资组合形成过程中,增强决策的基础,捕捉资产的内在特性。主成分分析(PCA)用于比特币投资组合构建,简化复杂市场数据,识别价格变化的关键驱动因素。


资产价格相关性对投资组合多样化至关重要,有助于降低风险。网络建模可视化和量化分析不同加密货币之间的相关性,揭示复杂的相互依赖关系。网络分析比单一货币信息更能提供市场动态的洞察。股票市场的网络基础投资组合选择方法(如最小生成树)优于随机选择,优化投资组合多样化。滚动相关性分析有助于捕捉股票市场的动态行为和聚类模式。最小生成树结构有助于识别潜在投资机会,关注外围的低相关性资产。


本研究提出一种聚类算法,旨在从动态社区结构中提取静态聚类,关注更持久的加密货币关系。该方法结合时间序列分析和投资组合理论,提升传统社区检测的可靠性,帮助制定不易受短期波动影响的投资策略。该框架支持构建多样化的加密货币投资组合,利用高度相关的加密货币群体,最大化风险调整收益。


方法



加密货币价格回归


使用对数收益率转换价格时间序列以去除趋势。



研究期分为训练期和测试期,训练期为 ,其中Delta_T 为 351 天。投资评估期为 Delta_h) 从 1 到 14 天变化。未来时间 t_h 的对数收益率预测公式为



加密货币价格预测


比较分析了三种价格预测模型:ARIMA、LSTM和Na?ve方法。ARIMA模型为ARIMA(p, d, q),通过最小化赤池信息量准则(AIC)优化预测性能。LSTM为一种递归神经网络,保留历史信息,使用TensorFlow进行拟合,调优超参数(如单位数、丢弃率、学习率和序列长度)。Na?ve方法简单地使用训练期最后观察值进行预测,假设价格行为不变。


使用均方误差(MSE)评估每种模型的预测性能。



加密货币相关性网络


使用固定的30天周期计算不同加密货币之间的相关性,以跟踪其动态关系。构建加权网络,节点代表加密货币,边表示其相关性ρij,相关性小于阈值θρ(0.5)将被忽略。采用对数收益的Pearson相关系数ρij,范围从-1到+1,表示线性关系的强度和方向。



网络聚类


网络社区由节点组构成,同一社区内节点连接密集,社区间连接稀疏。模块度Q量化网络社区划分程度,Q值越高,网络模块化结构越明显。Q的计算公式涉及节点间边的权重、节点的加权度和总边权重m。



δ(c_i, c_j)函数判断节点i和j是否属于同一社区。Louvain算法通过最大化模块度来检测网络社区。


本文应用Louvain算法识别加密货币相关网络的社区结构。Louvain算法的结果依赖于初始条件,因此设计了一种检测高度相关的加密货币的时间稳健聚类方法。社区检测过程重复n=30次,每次将检测间隔?c向后移动一天,生成n个网络。通过聚合n个时间间隔的社区检测结果,构建N×N相似度矩阵S,矩阵元素s_ij表示加密货币i和j在同一社区中的出现次数。


归一化相似度分数s~_ij计算为s_ij/n,范围从0到1,表示加密货币的共同出现频率。通过对归一化网络S~应用阈值θ_M=0.5,提取强相互依赖的加密货币聚类,去除边权小于θ_M的连接。最终的聚类结构通过层次分解获得,增强了聚类的可靠性,去除了虚假成员关系。


投资组合形成策略


投资组合是个人或实体持有的金融资产组合,旨在平衡风险与回报。采用强健聚类结构识别相互依赖的加密货币群体,以实现多样化投资组合。



本文提出了四种策略,利用历史和预测价格数据识别价格相关网络中的强健聚类:

  • 基线策略:仅使用历史价格数据,重复在相同时间间隔内进行社区检测。

  • S策略:同样依赖历史数据,但检测间隔向后移动,利用不同时间段的历史模式。

  • P策略:将预测价格数据纳入网络构建,进行社区检测。

  • P-S策略:结合预测价格和历史数据,识别加密货币之间的持久相关性。


各策略旨在捕捉市场行为的不同方面,提升加密货币聚类结构的准确性和稳健性,从而优化投资组合构建。


加密货币投资组合


最优资产配置是投资组合管理的核心问题,现代投资组合理论(MPT)为资产权重分配提供了框架,适用于传统和非传统资产(如加密货币)。加密货币的价格相关性可用于增强投资组合的多样化和风险回报表现。


本研究通过夏普比率(SR)进行投资组合优化,旨在最大化风险调整后的收益。投资组合的预期收益通过各资产的加权平均计算,波动率则通过加密货币收益的协方差矩阵和权重向量计算。采用PyPortfolioOpt库进行SR优化,利用其高效前沿模块简化资产权重分配过程,以实现风险调整后的收益最大化。



投资组合评估指标


平均交易(AT):计算每笔交易的平均利润或损失,正值表示策略盈利。



胜率(WR):衡量策略盈利交易的比例,胜率大于0.5表示策略成功。



利润因子(PF):总利润与总损失的比率,利润因子大于1.0表示策略有效。



加密货币价格数据


数据集包含5,450种加密货币的每日收盘价格。提取了2022年2月22日市值最高的1,000种货币。选取了2017年11月15日至2022年4月15日间持续交易的货币。排除了价格缺失超过十天的货币。最终数据集包含157种加密货币的时间序列价格(以美元计)。


结果


描述性统计


研究分析了前五和后五种加密货币的价格回报数据,揭示了它们的波动性、偏度和峰度等特性。



比特币(BTC)和以太坊(ETH)显示正的平均回报,而低市值的加密货币如DLT和FUEL则表现出负的平均回报。低市值加密货币的标准差较高,FUEL的波动性最大,表明其风险更大。所有加密货币的对数回报序列经过增强的迪基-福勒(ADF)检验,结果显示平稳性,统计特性不随时间变化。



价格相关性矩阵显示高市值加密货币(BTC、ETH、LTC)之间相关性高,而稳定币USDT与其他加密货币相关性低。USDT作为稳定币在市场动荡时吸引投资者,可能导致市场相关性迅速变化,给预测模型带来挑战。


价格预测表现


评估了三种价格预测方法:ARIMA、LSTM和Na?ve方法,基于42个研究期,每期包含351天的训练期和最多14天的测试期。



在市场稳定期,BTC和ETH的日均均方误差(MSE)较低。BTC的平均MSE:LSTM最低(5.80×10??),ARIMA次之(6.34×10??),Na?ve方法最高(29.77×10??)。ETH的MSE普遍高于BTC,LSTM略低(15.04×10??),ARIMA(16.53×10??),Na?ve方法最高(40.21×10??)。



COVID-19疫情导致全球市场不确定性增加,尤其是加密货币的波动性上升。在1至14天的预测期内,BTC和ETH的平均均方误差(MSE)显著上升,ARIMA和LSTM的表现下降,Na?ve方法相对更具韧性。ARIMA在稳定环境中通常优于Na?ve方法,但在波动加剧时优势减弱,显示出对市场突变的预测挑战。



通过计算42个研究期的中位MSE,ARIMA在几乎所有预测区间中表现最佳。大多数加密货币的中位MSE低于0.056,但DIME和ONION的预测难度较大,可能因市场波动性、流动性低或易受操控。


加密货币聚类识别


应用价格相关网络的阈值 θ ρ = 0.5 后,社区结构分析显示平均模块度 ? Q ? 值较低(约0.12),表明社区结构较弱。无滑动窗口策略(如Baseline和P(ARIMA))的平均模块度略高,而滑动窗口策略(如S和P(ARIMA)-S)则表现出更低的标准差,显示出更高的一致性但模块度降低。



最终集群的大小分布偏向单节点集群,P(ARIMA)策略产生更多单节点集群,尽管也有最大38节点的较大集群。单节点集群的主导地位导致加密货币选择的一致性,但较大集群的存在增加了随机选择过程的变异性,影响投资组合的多样性和收益的稳定性。



在基线和P(ARIMA)策略中,前20种加密货币中有14种在最大聚类中共同出现。一些不太知名的加密货币与BTC的走势相关,可能在投资组合中起到互补或对冲作用。这些加密货币在大聚类中的重复出现表明它们与其他加密货币有更显著的互动。投资这些加密货币可以帮助投资者通过聚类捕捉更广泛的市场网络,分散风险并获取潜在收益。



投资组合表现


评估了四种投资组合策略(Baseline, S, P(ARIMA), P(ARIMA)-S)的表现,使用平均交易(AT)、胜率(WR)和利润因子(PF)三个指标。所有策略在短期投资中表现良好,但随着投资期限延长,表现普遍下降。



AT在第一天表现强劲,9天持有期仍为正,但14天后仅P(ARIMA)保持正值,且AT的标准差随持有期延长而降低。WR在第一天超过0.69,P(ARIMA)在14天内保持不低于0.50,显示出稳定的盈利概率。PF在初期均高于1,但随时间推移下降,表明长期盈利能力减弱。P(ARIMA)策略在整个投资期内表现较强,Baseline策略在短期和长期均表现稳健,显示出聚类策略的有效性。


Baseline和P(ARIMA)投资策略在9天内表现稳健,P(ARIMA)策略在所有指标上均保持盈利。Baseline策略在投资期内有92.86%的概率获得正回报,而P(ARIMA)策略则为100%。P(ARIMA)策略在1天投资期内的平均预期回报为486.21%。两种策略的WR在9天内均保持在0.5以上,P(ARIMA)策略在较长投资期内WR更高。P(ARIMA)策略的PF在整个研究期间保持在1以上,显示出持续盈利和有效风险管理。Baseline策略初期表现强劲,但随着时间推移盈利能力下降,表明P(ARIMA)策略更能捕捉价格变动和趋势变化。



基于时间序列预测的投资组合策略在较长投资周期内表现优于仅依赖历史数据的基线策略。P(ARIMA)策略通过预测价格变动增强当前市场数据的聚类检测,适应市场趋势更有效。ARIMA模型在本研究中比LSTM模型计算效率更高,但预测模型需大量计算资源,可能导致投资回报下降。


尽管预测和移动窗口策略在适应市场动态和提高回报方面有优势,基线策略因其低计算需求和稳健表现仍是可行选择。准确理解加密货币之间的相关性和相互依赖性比直接价格预测更为重要,有助于构建多样化投资组合以降低风险和提高回报。


总结


本研究提出了一种综合方法,结合预测分析、投资组合理论和网络分析,以优化加密货币投资组合的选择,最大化资产多样化。通过识别高度相关的加密货币集群,捕捉其内在依赖关系,从而提高投资组合的多样性和潜在回报。采用基于历史价格数据的预测模型,平衡前瞻性和回顾性洞察,揭示加密货币之间的重要相关性。目标是识别持续高度相互依赖的加密货币群体,促进自动化投资组合选择,优化风险管理和回报。评估投资组合表现时,结合关键指标,发现整合预测价格信息的策略优于仅依赖历史数据的策略。


研究表明,加密货币已足够成熟,适合风险承受能力强的投资者纳入激进投资组合。采用先进聚类技术和网络社区分析,提升投资策略的转型潜力。投资者和监管机构可利用聚类技术优化资产配置和风险管理。建议广泛采用此类方法以改善投资结果,适应市场变化。



▌关于我们

我们致力于人工智能、量化交易领域前沿研究,分享前沿论文、模型代码、策略实现。如有相关需求,请私信与我们联系。

▌商务合作

请加微信“LingDuTech163”,或公众号后台私信“联系方式”。


关注【灵度智能】公众号,获取更多AI资讯。