机器学习技术在币种分析中的应用
谈到机器学习,大家可能会对这个AI方面的概念比较陌生,但如果提到谷歌AlphaGo,大家肯定就很熟悉了。当年谷歌人工智能程序通过机器学习的方式掌握围棋比赛技巧后,轻松击败了多个国家的围棋冠军,时隔3年世界冠军韩国李世石宣布退役时,还高呼AI不可战胜......通过机器学习训练后的计算机程序,在某些类似比赛和交易这样的博弈场景中,是比人类具有更高胜率的。
非小号研究本次就做了一个硬核的试验:将机器学习技术应用在币种分析中,看看会有什么好玩的结论,以及是否真的能够帮助我们判断、交易。
我们的具体课题是,通过现有的市场公开数据预测明日收益率为正还是为负。
这是一个二分类问题,我们可以使用的模型有很多,这里我们选用了以下模型用于实验:逻辑回归LR、线性判别分析LDA、二次判别分析QDA、支持向量机SVC、决策树DT、随机森林RF、渐变提升树GBC等。
本次用来试验的数据主要有三个方面:
Vitalik:以太坊需要改进的不仅是协议的功能,需要对应用程序和钱包进行深度改变:金色财经报道,以太坊创始人Vitalik Buterin发布《The Three Transitions》文章。Vitalik称,当以太坊从一个年轻的实验性技术过渡到一个成熟的技术栈,能够真正为普通用户带来开放、全球和无需许可的体验,堆栈需要大致同时经历三个主要的技术过渡:向L2扩展过渡,每个人都转向Rollup;向钱包安全过渡,每个人都使用智能合约钱包;向隐私过渡,确保保护隐私的资金转移可行。
由于上述原因,这三个转变至关重要。但它们也具有挑战性,因为要妥善解决这些问题需要密切协调。需要改进的不仅是协议的功能;在某些情况下,我们与以太坊交互的方式需要从根本上改变,需要对应用程序和钱包进行深度的改变。[2023/6/9 21:27:01]
1、资产的历史数据;
2、相关品种,如黄金原油美国三大股指等;
3、币圈相关币种数据,主要是主流币。
ARK首席执行官:颠覆性创新似乎处于深度价值领域:金色财经报道,ARK首席执行官Catherine Wood再其官网发布了《创新股并非泡沫:我们相信它们处于深度价值领域》研究文章,Catherine Wood表示,在五年的投资时间范围内,我们对这些平台的预测表明,我们今天的策略可以在未来五年内实现 30-40% 的复合年回报率。换句话说,如果我们的研究是正确的,我相信我们对创新的研究是金融界最好的。那么我们的战略将在未来五年内实现三倍至五倍的价值。然而,随着今年接近尾声,投资者似乎对“稳扎稳打”更感兴趣,并更接近基准,我们认为,在未来十年内,这些基准不太可能产生平均回报。就像 ARK 早期对电动汽车特斯拉和比特币的研究和投资一样,颠覆性创新似乎处于深度价值领域。根据我们过去八年的研究,未来十年超过 200 万亿美元。[2021/12/22 7:55:56]
完整的机器学习建立流程
1.首先,特征工程
特征工程是机器学习中最关键的步骤,没有之一。
Asproex(阿波罗)与DW2100达成深度合作:据官方消息,2020年11月3日,Asproex(阿波罗)与DW2100正式达成深度合作,DW2100支持MOON直接扫码支付。此次双方强强联合,旨在为平台用户提供更为广泛、更为丰富的Moon消费场景,扩大AsproPay的支付边界。据悉,DW2100还特推出专属阿波罗1号酒,用户使用AsproPay支付时可享受专属折扣。
DW2100是由数字工场、TODO BLOCK、彼岸花资本共同打造的行业资源直通平台和高端商务私人会所,同时又是一家专业的鸡尾酒、威士忌、雪茄吧和网红打卡圣地。据悉,DW2100目前还正在紧张筹备另外一家中国风夜店,旨在推广国潮文化的同时也为行业提供千人规模以上的活动平台。
Asproex(阿波罗)作为一家离岸银行控股持牌交易平台,涵盖CTO(Corporate Token Offering)企业通证上市、合约跟单、ETT指数通证、数字矿业、Digital Bank板块并持有5国合法牌照,致力于为全球中小微企业提供数字化上市一站式服务。[2020/11/3 11:32:33]
这有别于大众认知的AI能解决一切问题,人工智能是万能的认知。真实的情况是数据科学家们常挂在嘴边的一句话是“输入的是垃圾,输出的也一定是垃圾”,这意味着特征工程做得好不好会直接影响AI的“智商”。
动态 | 国泰君安积极探索区块链等技术 推动金融服务与科技深度融合:据新华网消息,近日,国泰君安君弘APP新推出的Level-2 Plus功能,积极探索移动互联、大数据、人工智能、云计算、区块链等新技术,推动金融服务与科学技术深度融合发展。[2018/9/27]
特征工程不止是数据需要清洗重新组合,还需要将数据进行标准化处理。
2.其次,建模
建模是一个简单的过程,模型在那里,无非是灌入数据后不断地调参优化。国内很多大互联网公司的AI团队也都是在常用模型中选择靴子不断优化,大家的过程都是一样的,没有什么捷径。
3.评价模型效果
模型的效果评估有很多,常见的有MSE,MAE,取代矩阵,ROC等。
4.最终,应用
当模型对数据的可解释度良好时,模型可用。一般这个可解释度要达到80%以上,90%以上更好,但如果100%可解释就需要注意是否出错了。
麦迪森控股:推进区块链深度合作,加快驱动战略转型:继4月3日,麦迪森控股发布日本著名虚拟货币交易平台BIT Point股权收购计划后,又有重大动作。今天上午8点,集团再发公告,就此次交易合作事项进一步做出补充说明,根据公告显示,集团与BIT Point已就虚拟货币交易平台以及相关业务的投资布局与发展具体计划签署一致协议。麦迪森控股集团借助BitPoint在虚拟货币业务的技术积累以及在海外市场的资源优势,完成业务战略加速转型,并实现自身快速发展盈利可期。[2018/4/17]
对BTC的解释性
数据一
仅有高开低收量,及高开低收量计算的技术指标作为训练数据。得到各个模型解释度如下表所示:
由上表可以得到,单纯的用高开低收量和技术指标作为特征,在以上机器学习模型中训练,无法很好地解释价格。其实仅从这里就能看出币圈属于弱势有效市场。技术分析得到的尺度是判断二分类正确概率是50%,即模型无效,也与弱势有效市场中技术分析无效,基本面分析和内幕信息有效相吻合。
市场包含三种信息:历史信息,公开信息和内幕信息。
各种信息分别对应不同分析交易策略:历史信息对应技术分析;公开信息对应的基本分析;内幕信息对应的内幕交易。
当市场有效时,市场已反映三种信息,故对三种信息的分析均值不能在市场获得优势,某种分析和交易策略均值无效;当市场为半强势有效时,市场已反映公开信息和历史信息,故技术分析和基本分析无效,内幕交易有效;当市场为弱有效市场时,市场只反映历史信息,故技术分析无效,基本分析和内幕交易有效。
数据二
不但有高开低收量数据,我们还增加了相关品种的数据,如美国三大股指,黄金,原油,币圈主流币种等作为训练数据。
为什么认为美国三大股指,黄金,原油,币圈其他主流币种等数据可以插入基本面数据?
虽然这些因素不是直接影响BTC的基本面因素,但是它们和BTC由相同的基本面因素影响,所以这些数据中包含很少的一部分基本面信息。
由上表可以得知:在增加基本面替代特征后,解释度提升了10%以上。
那么提高多少可解释度是模型极限?
经过1000次的实验得到,当随机因子为1730时,随机森林RF模型的可解释度67%,这是所有实验中所有模型中可解释度最高的一组。
模型效果的衡量:
混淆矩阵
混淆矩阵就是分别统计分类模型归错类,归对类的观测值个数,然后把结果放在一个表里展示出来。这个表就是混淆矩阵,把预测情况与实际情况的所有结果两两混合,结果就会出现以下几种情况,就组成了混淆矩阵。如下:
ROC曲线
ROC曲线,又称接受者操作特征曲线。该曲线最早应用于雷达信号检测领域,用于区分信号与噪声。后来用于评价模型的预测能力,ROC曲线是基于混淆矩阵得出的。
ROC曲线中的主要两个指标就是真正率和假正率,其中横坐标为假正率,纵坐标为真正率,下面就是一个标准的ROC曲线图。
横轴FPR:1-TNR,1-Specificity,FPR越大,预测正类中实际负类越多。
纵轴TPR:Sensitivity(正类覆盖率),TPR越大,预测正类中实际正类越多。
为什么解释性不强?
1.交易量数据造假
2.未有数据披露制度约束,未形成一体的基本面数据
3.市场有可能存在内幕信息
目前我们模型中的数据还不够全面,仍然需要更多的努力揭示更多的基本面信息,才能更好地解释BTC价格。
在披露更多信息时,才能促进市场效率的提高,促进币圈的发展,这也是“非小号”作为机构应该做且做好的事情。
是否有使用价值?
虽然机器学习在解决传统问题时都要求正确率达到80%甚至90%以上才可以使用,但是我们能否使用一个解释度在60%-70%之间的模型?
-1.模型是有解释度的,60%也远高于50%,长期预测胜率显著高于50%的多空各一半的平均水平,这有点类似庄家在轮盘中有概率优势一样,时间越久赢面越大;
-2.加入限制条件时可以提高概率,单次若想取得概率优势只能限制使用条件
如下所示为决策树输出的树形图,用红色框起来的枝杈正确率很高,但是只有满足层层条件后才会有交易机会。为了达到盈利目的,交易者要在交易机会与单次交易盈利水平中找到平衡点。
单个树杈局部图如下所示,当满足红框圈住的条件时,正确率提高到93%,这完全达到了使用要求:
对ETH和TRX的解释性
从模型训练结果看,已知特征使用以上模型训练时,可解释度也在60%-70%之间。下面我们列举一些有价值的树杈,树杈概率的提高是基于条件概率提升的。
ETH
由以下ETH树形图可以看出,当同时满足条件
美元比eth收盘价<0.01,eth昨日成交量<3956783616,原油成交量>117392.5,涨跌幅>0,黄金开盘价<1489.25时,时,有93%的正确率,这时交易机会是总交易机会的19.05%(28/147)。
TRX
由以下TRX树形图可以看出,当同时满足条件bch<289.51,bsv>63.5,美元比eth调整后收盘价>0.01,纳指收盘价<8371.12,道指最低价>24290.5,美元比eth收盘价>0.01,瑞波币收盘价<0.32时,有82%的正确率,这时交易机会是总交易机会的23.68(36/152)。
如果以上使用机器学习来分析不同币种交易机会的流程没看懂,也没有关系,涉及到的知识比较复杂。所以,非小号后期将应用很多大数据或AI等技术帮助大家建立分析模型,直接在APP中为大家提供易懂和好用的币价预测工具或投资策略参考,一键体验。
太空竞赛终于开始了,从8月25日到今天9月5日,21天的赛程已经过半。在各种数据面前,再华丽的营销,也失去了说服力。李逵李鬼,一目了然。编辑?经过近两周的角逐.
1900/1/1 0:00:00公告编号2020090501各位关心ZBG.io的投资者们和项目方:由于钱包维护,如下币种将于HKT2020年9月5日18:00-21:00暂停充提币,预计3小时,维护完毕后将自动恢复.
1900/1/1 0:00:009月3日上午,山东济南正式发布启动全市统一的政务区块链平台“泉城链”,在全国首创“政府数据上链+个人链上授权+社会链上使用+全程追溯监管”的政务数据可信共享新模式.
1900/1/1 0:00:00基本信息:英文全称:tBridge英文简称:TAI项目简介:tBridge.io是TronFi生态系统中最重要的部分之一,它是一个跨链资产交换解决方案.
1900/1/1 0:00:00尊敬的用户:AOFEX于2020年9月3日上线ATDF,按AOFEX新项目上线计划对OT进行销毁。截止目前,AOFEX已累计销毁1,801,249OT.
1900/1/1 0:00:00日本金融巨头SBIHoldings已宣布计划启动以区块链技术为动力的数字证券交易所。根据《日经新闻》报道,该计划是SBI首席执行官北山洋孝的创意.
1900/1/1 0:00:00