2. 金融股票數據的另一個形態,怎樣在業務內部流動,同時怎樣避免錯誤 前一篇講解了股票的原始狀態,那麼在業務過程中,數據會變成怎樣的形態,來完成眾多奇奇怪怪的業務呢,以下將會解答。 首先,任何股票都有機會停市,退市。或者退市了再二次上市。 例子,阿裡爸爸(9988.HK)在港交所二次上市。 再例如, ...
2. 金融股票數據的另一個形態,怎樣在業務內部流動,同時怎樣避免錯誤
前一篇講解了股票的原始狀態,那麼在業務過程中,數據會變成怎樣的形態,來完成眾多奇奇怪怪的業務呢,以下將會解答。
首先,任何股票都有機會停市,退市。或者退市了再二次上市。
例子,阿裡爸爸(9988.HK)在港交所二次上市。
再例如,富力地產(2777.HK),12供2股的方法向市場增發當天,停牌一天。
這種情況下,某些股票的數據就會斷斷續續,不連貫。
那麼惟一叄考的標準,就只有大盤指數的數據,才是最信得過的依靠。
因此把數據拿了回來,應該用大市指數的交易日,作為整個Dataframe的index,然後註入其他股票數據在這Dataframe,才能最完整地保證不出錯。
以上數據全是亂編,不用細看。
假設邵匡概念基金,在1月9日~1月10日之間停牌分紅,那麼該2天就不會有收市價。
可其他股票0700騰訊,1299友邦是正常交易日。
所以這就避免了很多業務問題,如:
a. 邵匡概念基金和友邦的過往5天股價對比圖,由於邵匡概念基金是停牌,所以那2天不能畫到股價線。這避免了拿錯了1月2日,1月3日,1月7日,1月8日,1月11日,這樣5個交易日的數據。
b. 計算含多只股票的板塊的貝塔值,波動率等,由於邵匡概念基金和該2天停牌,那麼計算均值應該是(370+82)/2,(騰訊+友邦)/2。而不是(370+82+0)/3,(騰訊+友邦+邵匡概念)/3,這樣計算肯定尋死。