百度推廣 SEM閃投系統

来源:http://www.cnblogs.com/wangyulu/archive/2017/02/17/6410440.html
-Advertisement-
Play Games

近期做了一個關於百度營銷推廣的一個管理系統(SEM閃投),主要包括閃投欄位到資料庫欄位的關係映射,多庫多表數據的查詢封裝組合到最後生成XML文件,最終SFTP到另一個資源伺服器上,然後百度要能夠訪問這個XML並解析它,你在百度上搜索某個關鍵詞的時候,最上面的幾條帶廣告字樣的,那麼就達到效果了(關鍵是... ...


 近期做了一個關於百度營銷推廣的一個管理系統(SEM閃投),主要包括閃投欄位到資料庫欄位的關係映射,多庫多表數據的查詢封裝組合到最後生成XML文件,最終SFTP到另一個資源伺服器上,然後百度要能夠訪問這個XML並解析它,你在百度上搜索某個關鍵詞的時候,最上面的幾條帶廣告字樣的,那麼就達到效果了(關鍵是 money!!!)

在這過程中遇到了一些問題,也踩了不少坑。。在此記錄一下;

第一步:多庫多表的數據查詢,從庫里拿到元數據由於數據量以後會越來越大,首先計算出總的數據量,然後做分頁查詢,先查詢主表的數據,每次查詢的數據量為1000(可配置),然後根據查詢的這1000條數據的主鍵ID迴圈查詢其它擴展表的擴展表數據,到此第一次取元數據結束;

第二步:閃投欄位賦值,分為以下幾部分:
1.元數據與閃投欄位映射關係中對應的欄位作數據替換處理
2.映射欄位中常量里的特殊欄位進行替換操作。
3.通過第一次拿到的元數據,再去關聯其它的庫表進行查詢得到數據,把拿到的數據
進行1一樣的替換處理。

通過以上對數據的處理,已經得到最終輸出到XML里的數據,這裡會以每2000(可配置)條數據輸出到一個XML文件里。

第三步:最後拿到處理好的數據,直接輸出到XML文件里(在數據輸出的時候又稍做了些替換,主要處理邏輯還是在第二步)

第四步:將生成的XML文件上傳資源伺服器。
在生成本地文件後,會有上傳到遠程伺服器的動作,這裡是個同步的操作,即我會記錄
上傳成功/失敗狀態,然後入庫

遇到的問題及處理方案:
每次查詢的數據量要可配置:
在查詢數據的時候,每次查詢的數據量不能固定寫在程式里,由於每個環境的伺服器配置及性能問題,以後更改方便,所以定義在配置文件里。

由於取擴展表數據的時候是in主表的主鍵ID,在實際生產環境里只配置了500,在每次輸出數據到XML文件完成後,即要釋放一次數據占用的記憶體;


保存數據到XML文件里遇到的問題:
即寫入數據到XML文件的時候用的是file_put_contents,發現會有文件寫的不完整,也就是文件還沒寫完,程式繼續往下執行了,臨時解決方案是sleep,但最終這裡還是需要優化(後面會改成fwire);

寫入XML文件內容中有用 <![CDTD[]]> 導致文件格式錯亂,解析方案:Heredoc技術,如:

$S = <<<EOT
......
EOT;

XML文件上傳到遠程所遇到的問題:
上傳文件用的SFTP,即上傳文件完成後發現遠程伺服器上的文件數據並不完整,開發環境是正常的,測試環境上是不正常的,網上搜了些資料說每次上傳完成後,要手動的關閉下會話鏈接,這樣才會把緩存區的數據全部寫入到磁碟,用sftp_exec(session, 'exit);但測試後發現好像並沒能什麼用呢,最後決定上生產環境,跑了下數據發
現並沒有不完整。(在與環境做鬥爭。。)


頻繁的數據查詢導致的STMT_PREPARE問題:
即查詢頻率太大,最終的解決方案是每次都重新鏈接資料庫進行查詢。

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 作為一名網路警察,你的任務是監視電子郵件,看其中是否有一些敏感的關鍵詞。不過,有些狡猾的犯罪嫌疑人會改變某些單詞的字母順序,以逃避檢查。請編寫一個程式,發現這種調整過順序的關鍵詞。程式的輸入有兩行,第一行是關鍵詞列表,第二行是待檢查的句子。程式的輸出為在該句子中所找到的經過順序調整的關鍵詞。(單詞全 ...
  • 轉載請標明出處: "http://www.cnblogs.com/why168888/p/6411664.html" 本文出自: "【Edwin博客園】" python進階介紹(進階1) 1. python基礎回顧 1. 安裝Python環境 2. 變數和數據類型:Python內置的基礎類型 3. ...
  • 內部類:在類中定義的類,外層的叫外部類、外圍類。 書中說P191,如果想在外部類的非靜態方法之外的任意位置創建某個內部類對象,那麼必須像在main方法(靜態方法)中那樣,具體地指明這個對象的類型:OuterClassName.InnerClassName。(在外部類非靜態方法中可以直接使用Inner ...
  • 分情況討論: 非const引用非const: 非同類型不能引用 非const引用const: 不能通過編譯。因為要引用,說明你要改值。。 const引用非const: 第一種情況:const引用與非const同類型。 很奇怪,這是可以通過編譯的!而且,const能變化值!(原因是引用並沒有綁定臨時值 ...
  • 本篇隨筆主要描述的是我閱讀 HashMap 源碼期間的對於 HashMap 的一些實現上的個人理解,用於個人備忘,有不對的地方,請指出~ 接下來會從以下幾個方面介紹 HashMap 源碼相關知識: 1、HashMap 存儲結構 2、HashMap 各常量、成員變數作用 3、HashMap 幾種構造方 ...
  • 需求按優先順序順序如下: 1)存放3TB以上中小型文件,圖片為主,平均在500~700k,一般在1M以內。 2)要集群化,支持負載均衡,高可用高性能。有大企業使用背書最好。 3)提供Java程式上傳文件的手段。Java代碼可以在Windows環境下調試。 4)必須開源,作者能保持更新。 5)有運維監控 ...
  • mybatis 一對一查詢的兩種方式的實現,較為詳細。歡迎新手學習及大神指導。 ...
  • 1.什麼是內部類? 定義在類內部的類,稱之為內部類 2.為什麼要使用內部類? 1),增強封裝,把內部類隱藏在外部類中,不允許其他類來訪問內部類 2),內部類能提高代碼的可讀性和可維護性 3.內部類的分類 對於內部類的分類,可以對比於成員變數的分類. 我們可以根據不同的修飾符或者定義的不同位置把成員變 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...