某天,某部門負責人小姐姐:要在訂單中識別收貨人手機號碼歸屬地,這樣可以參考判斷該客戶是否為惡意下單。搬磚君:可以,有兩種方案; 一、網上買個API介面(需要RMB支持); 二、找個手機歸屬地庫(免費,有可能不是最新);小姐姐:申請RMB,估計領導不會簽字,那就免費的吧。搬磚君:好吧,(此時心中一萬個 ...
某天,某部門負責人小姐姐:要在訂單中識別收貨人手機號碼歸屬地,這樣可以參考判斷該客戶是否為惡意下單。
搬磚君:可以,有兩種方案;
一、網上買個API介面(需要RMB支持);
二、找個手機歸屬地庫(免費,有可能不是最新);
小姐姐:申請RMB,估計領導不會簽字,那就免費的吧。
搬磚君:好吧,(此時心中一萬個。。。(你們懂的));
於是某度搜索 手機號碼歸屬地最新資料庫 排名第一的居然是園子里的高手,瞬間興奮起來,
打開鏈接看到 github ,心想這下不要去擼碼找數據了。結果翻遍每個文件夾只有查詢方法,卻沒有庫。
再往下看原來庫是有 購買 鏈接,還有升級鏈接。看來這路走不通了。
再翻了下某度的其它搜索結果,要麼不最新,要麼收費,要麼就是登錄需要積分下載。
心想去找個API介面把他的數據擼出來就好了。 繼續某度 手機號碼歸屬地查詢API介面 ,
經過測試,比對,找了4個可用而且可信度比較高的。
開始擼碼【抱歉,數據源和數據入庫 畫面請各位小伙伴自行腦補】:
private static List<string> MobileList = new List<string>(); // 中途中斷後, 已經存在的手機號段列表 using (SqlConnection conn = new SqlConnection(ConStr)) { if (MobileList.Count == 0) { string temp_sql = $"SELECT [Mobile] From [App_Mobile_20191113]"; using (SqlCommand command = new SqlCommand(temp_sql, conn)) { command.CommandType = System.Data.CommandType.Text; if (conn.State == ConnectionState.Closed) conn.Open(); using (SqlDataReader dreader = command.ExecuteReader()) { while (dreader.Read()) { MobileList.Add(dreader[0].ToString()); } } } } }
一個號碼段前三位一個線程
List<Task> taskList = new List<Task>(); TaskFactory taskFactory = new TaskFactory(); // 從手機前3位 130 開始 至 199 結束 for (int i = 130; i < 200; i++) { int mobile_no = i; taskList.Add(taskFactory.StartNew(() => { Console.WriteLine($"{mobile_no} = {Thread.CurrentThread.ManagedThreadId}"); Get(mobile_no); })); } Task.WaitAll(taskList.ToArray());
開始獲取數據
static void Get(int start_no) { int start_mobile = int.Parse($"{start_no}0000"); int end_mobile = int.Parse($"{start_no}9999"); // 獲取某開頭下的所有號碼段 如: 1300000 - 1309999 for (int i = start_mobile; i <= end_mobile; i++) { if (MobileList.Contains(i.ToString())) continue; //已經存在的號碼 int code = new Random().Next(1000, 9999); // 隨機手機號碼最後4位 string mobile = $"{i}{code}"; //獲取數據 【抱歉,數據來源畫面請各位小伙伴自行腦補】 ModelMobile model = Get1(mobile); // 數據源1 if (!model.QueryResult || string.IsNullOrWhiteSpace(model.Province)) model = Get2(mobile); // 數據源2 if (!model.QueryResult || string.IsNullOrWhiteSpace(model.Province)) model = Get3(mobile); // 數據源3 if (!model.QueryResult || string.IsNullOrWhiteSpace(model.Province)) model = Get4(mobile); // 數據源4 //獲取成功後入庫【入庫畫面請各位小伙伴自行腦補】 if (model.QueryResult) { if (save_data(model)) Console.WriteLine($" {Thread.CurrentThread.ManagedThreadId}. Success \t{i} = {model.Province} {model.City} ({model.Corp}) [{model.Source}] ......"); else Console.WriteLine($" {Thread.CurrentThread.ManagedThreadId}. SaveFail \t{i} = {model.Province} {model.City} ({model.Corp}) [{model.Source}] ......"); } else Console.WriteLine($" {Thread.CurrentThread.ManagedThreadId}. Fail \t{i} = {model.Message} [{model.Source}] ......"); } }
運行效果:
爬完所有號段後,數據總 442245 條,比某度排第一園子里的高手還要多。
只要源數據正常,這庫還可以一直正常升級。
擼碼完成,敢快去通知小姐姐,已經可以正常調用了。