網上普遍使用的化學方程式的格式普遍如下 例: KMnO4+FeSO4+H2SO4=Fe2(SO4)3+MnSO4+K2SO4+H2O 要把化學方程式格式化,單單一個正則表達式是非常反人類的,故可選用 C++ 實現化學方程式的格式化。 首先,寫一個 for 迴圈,傳入字元數組 input[] ,依次地 ...
網上普遍使用的化學方程式的格式普遍如下
例: KMnO4+FeSO4+H2SO4=Fe2(SO4)3+MnSO4+K2SO4+H2O
要把化學方程式格式化,單單一個正則表達式是非常反人類的,故可選用 C++ 實現化學方程式的格式化。
首先,寫一個 for 迴圈,傳入字元數組 input[] ,依次地判斷當前字元的位置
然後,聲明一個寬字元串: wstring output[]
演算法根據迴圈里的 if 語句判斷當前字元是否符合條件,然後把這個字元輸出到 output[] 中
for(int i=1;i<strlen(input);++i) { // Do something... };
因為傳入的字元數組是沒有經過格式化的,所以第一個字元一定不用處理,故迴圈從1開始。
迴圈開始時,先判斷當前的字元是不是空格,如果是空格,就直接無視,跳到下一次的迴圈。
因為直接跳到了下一次的迴圈中,所以 input[i] 的字元沒有加入到 output 中,也就是自動地把空格給除去了。
然後,在判斷當前的字元是否為 +、=、(、) 中的一種,因為這個字元的前後是不可能存在數字下標的,直接加入到輸出的 output[] 數組中。
同樣的,遇到前一個字元是 +、=、( 也同樣直接加入到輸出數組中。
實現代碼:
for (int i = 1;i < strlen(input);++i) { if(input[i] == ' ') continue; if (input[i - 1] == '+' || input[i - 1] == '=' || input[i - 1] == '(' || input[i] == '+' || input[i] == '=' || input[i] == '(' || input[i] == ')') { output += input[i]; continue; }
繼續我們的判斷,如果當前字元是 A-Z 、 a-z 的,直接加入輸出字元數組中。
如果當前字元是數字的,直接將它變成下標。
為了防止 C60 這種由超過 9 個原子組成的分子參與化學反應的情況,所以還要加入一句判斷語句來判斷。
實現代碼:
for (int i = 1;i < strlen(input);++i) { if(input[i] == ' ') continue; if (input[i - 1] == '+' || input[i - 1] == '=' || input[i - 1] == '(' || input[i] == '+' || input[i] == '=' || input[i] == '(' || input[i] == ')') { output += input[i]; continue; } if (input[i] >= 'A' && input[i] <= 'Z') { output += input[i]; continue; } if (input[i] >= 'a' && input[i] <= 'z') { output += input[i]; continue; } if (input[i - 1] >= '0' && input[i - 1] <= '9') { output += input[i]; continue; } if (input[i] >= '0' && input[i] <='9') { outputBigNumToSmall((int)(input[i]-'0')); } }
因為 C++ 標準庫並沒有把數字轉成下標的函數,所以我們要實現一個將數字轉成下標的函數
實現代碼:
void outputBigNumToSmall(int num) { switch (num) { case 0: output.append(L"₀"); break; case 1: output.append(L"₁"); break; case 2: output.append(L"₂"); break; case 3: output.append(L"₃"); break; case 4: output.append(L"₄"); break; case 5: output.append(L"₅"); break; case 6: output.append(L"₆"); break; case 7: output.append(L"₇"); break; case 8: output.append(L"₈"); break; case 9: output.append(L"₉"); break; default: output.append(L"(unknown)"); break; }
至此,只要輸出 output[] 就可以了。