百度推廣 SEM閃投系統

来源:http://www.cnblogs.com/wangyulu/archive/2017/02/17/6410440.html
-Advertisement-
Play Games

近期做了一個關於百度營銷推廣的一個管理系統(SEM閃投),主要包括閃投欄位到資料庫欄位的關係映射,多庫多表數據的查詢封裝組合到最後生成XML文件,最終SFTP到另一個資源伺服器上,然後百度要能夠訪問這個XML並解析它,你在百度上搜索某個關鍵詞的時候,最上面的幾條帶廣告字樣的,那麼就達到效果了(關鍵是... ...


 近期做了一個關於百度營銷推廣的一個管理系統(SEM閃投),主要包括閃投欄位到資料庫欄位的關係映射,多庫多表數據的查詢封裝組合到最後生成XML文件,最終SFTP到另一個資源伺服器上,然後百度要能夠訪問這個XML並解析它,你在百度上搜索某個關鍵詞的時候,最上面的幾條帶廣告字樣的,那麼就達到效果了(關鍵是 money!!!)

在這過程中遇到了一些問題,也踩了不少坑。。在此記錄一下;

第一步:多庫多表的數據查詢,從庫里拿到元數據由於數據量以後會越來越大,首先計算出總的數據量,然後做分頁查詢,先查詢主表的數據,每次查詢的數據量為1000(可配置),然後根據查詢的這1000條數據的主鍵ID迴圈查詢其它擴展表的擴展表數據,到此第一次取元數據結束;

第二步:閃投欄位賦值,分為以下幾部分:
1.元數據與閃投欄位映射關係中對應的欄位作數據替換處理
2.映射欄位中常量里的特殊欄位進行替換操作。
3.通過第一次拿到的元數據,再去關聯其它的庫表進行查詢得到數據,把拿到的數據
進行1一樣的替換處理。

通過以上對數據的處理,已經得到最終輸出到XML里的數據,這裡會以每2000(可配置)條數據輸出到一個XML文件里。

第三步:最後拿到處理好的數據,直接輸出到XML文件里(在數據輸出的時候又稍做了些替換,主要處理邏輯還是在第二步)

第四步:將生成的XML文件上傳資源伺服器。
在生成本地文件後,會有上傳到遠程伺服器的動作,這裡是個同步的操作,即我會記錄
上傳成功/失敗狀態,然後入庫

遇到的問題及處理方案:
每次查詢的數據量要可配置:
在查詢數據的時候,每次查詢的數據量不能固定寫在程式里,由於每個環境的伺服器配置及性能問題,以後更改方便,所以定義在配置文件里。

由於取擴展表數據的時候是in主表的主鍵ID,在實際生產環境里只配置了500,在每次輸出數據到XML文件完成後,即要釋放一次數據占用的記憶體;


保存數據到XML文件里遇到的問題:
即寫入數據到XML文件的時候用的是file_put_contents,發現會有文件寫的不完整,也就是文件還沒寫完,程式繼續往下執行了,臨時解決方案是sleep,但最終這裡還是需要優化(後面會改成fwire);

寫入XML文件內容中有用 <![CDTD[]]> 導致文件格式錯亂,解析方案:Heredoc技術,如:

$S = <<<EOT
......
EOT;

XML文件上傳到遠程所遇到的問題:
上傳文件用的SFTP,即上傳文件完成後發現遠程伺服器上的文件數據並不完整,開發環境是正常的,測試環境上是不正常的,網上搜了些資料說每次上傳完成後,要手動的關閉下會話鏈接,這樣才會把緩存區的數據全部寫入到磁碟,用sftp_exec(session, 'exit);但測試後發現好像並沒能什麼用呢,最後決定上生產環境,跑了下數據發
現並沒有不完整。(在與環境做鬥爭。。)


頻繁的數據查詢導致的STMT_PREPARE問題:
即查詢頻率太大,最終的解決方案是每次都重新鏈接資料庫進行查詢。

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 作為一名網路警察,你的任務是監視電子郵件,看其中是否有一些敏感的關鍵詞。不過,有些狡猾的犯罪嫌疑人會改變某些單詞的字母順序,以逃避檢查。請編寫一個程式,發現這種調整過順序的關鍵詞。程式的輸入有兩行,第一行是關鍵詞列表,第二行是待檢查的句子。程式的輸出為在該句子中所找到的經過順序調整的關鍵詞。(單詞全 ...
  • 轉載請標明出處: "http://www.cnblogs.com/why168888/p/6411664.html" 本文出自: "【Edwin博客園】" python進階介紹(進階1) 1. python基礎回顧 1. 安裝Python環境 2. 變數和數據類型:Python內置的基礎類型 3. ...
  • 內部類:在類中定義的類,外層的叫外部類、外圍類。 書中說P191,如果想在外部類的非靜態方法之外的任意位置創建某個內部類對象,那麼必須像在main方法(靜態方法)中那樣,具體地指明這個對象的類型:OuterClassName.InnerClassName。(在外部類非靜態方法中可以直接使用Inner ...
  • 分情況討論: 非const引用非const: 非同類型不能引用 非const引用const: 不能通過編譯。因為要引用,說明你要改值。。 const引用非const: 第一種情況:const引用與非const同類型。 很奇怪,這是可以通過編譯的!而且,const能變化值!(原因是引用並沒有綁定臨時值 ...
  • 本篇隨筆主要描述的是我閱讀 HashMap 源碼期間的對於 HashMap 的一些實現上的個人理解,用於個人備忘,有不對的地方,請指出~ 接下來會從以下幾個方面介紹 HashMap 源碼相關知識: 1、HashMap 存儲結構 2、HashMap 各常量、成員變數作用 3、HashMap 幾種構造方 ...
  • 需求按優先順序順序如下: 1)存放3TB以上中小型文件,圖片為主,平均在500~700k,一般在1M以內。 2)要集群化,支持負載均衡,高可用高性能。有大企業使用背書最好。 3)提供Java程式上傳文件的手段。Java代碼可以在Windows環境下調試。 4)必須開源,作者能保持更新。 5)有運維監控 ...
  • mybatis 一對一查詢的兩種方式的實現,較為詳細。歡迎新手學習及大神指導。 ...
  • 1.什麼是內部類? 定義在類內部的類,稱之為內部類 2.為什麼要使用內部類? 1),增強封裝,把內部類隱藏在外部類中,不允許其他類來訪問內部類 2),內部類能提高代碼的可讀性和可維護性 3.內部類的分類 對於內部類的分類,可以對比於成員變數的分類. 我們可以根據不同的修飾符或者定義的不同位置把成員變 ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...