大數據 + VR 全景技術重塑“二手車買車場景”

来源:https://www.cnblogs.com/88223100/archive/2023/04/11/Big-data_VR-panoramic-technology-reshapes-the-second-hand-car-buying-scene.html
-Advertisement-
Play Games

二手車交易的核心問題在於車況信息不透明。中國二手車交易市場制度尚不完善,長期以來缺少行業公認的車輛估值標準和車況檢測標準,二手車商提供的估值和車況信息不夠透明。這導致用戶和車商交易雙方都陷入了迴圈困境:用戶對車商信任不足,購買意願低。二手車商缺少潛在客戶線索,為招攬客戶不惜採用虛假信息,使得市場環境... ...


二手車交易的核心問題在於車況信息不透明。中國二手車交易市場制度尚不完善,長期以來缺少行業公認的車輛估值標準和車況檢測標準,二手車商提供的估值和車況信息不夠透明。這導致用戶和車商交易雙方都陷入了迴圈困境:用戶對車商信任不足,購買意願低。二手車商缺少潛在客戶線索,為招攬客戶不惜採用虛假信息,使得市場環境進一步惡化。
現階段,多方面的車輛信息已實現了物理層面上的集成,但在語義內容的解析和信息的視覺呈現上還有待深入研究。用戶需要親自閱讀碰撞、維保、電池報告來理解其中的內容,報告內容的豐富性、專業性與可讀性將對用戶的交易決策產生重要影響。例如,用戶瀏覽APP時被汽車外觀、內飾的照片所吸引,卻可能因不瞭解汽車車體結構和車況排查標準而無法準確理解相應的碰撞、維保、電池報告中所包含的眾多內容,最終導致交易轉化失敗。
為推動車況信息的透明化,汽車之家二手車不斷完善優化“車史檔案”,使二手車出險記錄查得率達到98%、維保記錄查得率達到85%,同時還有天天拍車平臺開展線下檢測業務,獲取真實的車況數據完善檔案數據。
圖片
傳統二手車買車場景 VS 數字化二手車買車場景
通過利用數字能力和數據資源不斷推動車況信息的透明化、標準化,使用戶更易瞭解車況信息,提高用戶決策效率和線索轉化效率。具體來說,結合機器學習、自然語言處理和VR全景等技術,我們重塑了二手車購買的業務場景,將二手車車源在估值、車史、VR全景展示三個維度的信息進行了集成與融合,以互動式可視化的形式呈現給用戶,使用戶更快捷、直觀、詳盡瞭解二手車車源的車況和估值,降低用戶的信息搜尋成本和信息理解成本,促進用戶做出交易決策。
圖片
圖1 傳統二手車買車場景和數字化二手車買車場景對比
如圖1所示,傳統的二手車交易需要用戶在不充分瞭解車輛信息的情況下與二手車商預約線下看車,再根據看車人的經驗知識做出主觀的評斷。而數字化的二手車買車業務則是用戶直接通過PC、APP從雲端獲取標準化的車輛信息,充分瞭解車輛信息、評估後再決定是否線下看車,有效提高線下看車的效率。汽車之家二手車在為用戶創造數字化體驗的過程中,除了促進購車交易,也提高了買車新模式的商業增長。

圖片

買車新模式:結構化數據+半結構化數據+全景數據
圖片
圖2 二手車買車業務架構 
二手車買車業務流程架構如圖2所示。結構化的數據來自從汽車之家二手車交易平臺中的二手車的車輛數據、交易記錄等數據。其中,二手車的車輛數據中包括省份、城市、車型、上牌時間、行駛里程、發佈時間、過戶次數等各種數據,二手車交易記錄中包括成交價格、交易類型、檢測車況等數據。這些結構化的數據按用於估值模型的訓練,預測車輛在當前及未來的價格趨勢。
半結構化的數據是指從第三方獲取的車輛出險記錄,4S店維修保養記錄、天天拍線下檢測記錄以及電池數據記錄,這些記錄具有多種數據類型,需要轉化為統一的數據格式,解析其中的語義內容,抽取結構化的信息。對於新能源車的電池數據經過加工解析生成電池線上檢測報告,綜合得出維保、碰撞、電池等多維度的車史報告。
全景數據是指通過VR外觀相機和VR內飾相機所拍攝的原始圖像數據,原始圖像數據經過VR拍攝組件生成VR圖片,再通過APP、H5端的VR播放組件進行展示。從非結構化數據中抽取出的結構化信息除了形成車史報告,也可以與VR中圖像進行跨模態的語義對齊,例如車史報告中如提到“左前門碰撞”,則可以在VR展示中提示出左前門的狀態異常。估值、車史和VR展示將共同呈現於用戶界面。
當用戶瀏覽通過PC、APP瀏覽二手車車源詳情時,可在用戶界面查看車輛估值信息,查詢車史報告,VR全景看車,從價值、車況、外觀內飾三個角度來評估車輛是否符合需求,決定是否購買或留下購車線索。

圖片

技術實現難點
估值:車輛的數據十分複雜,通常包括了區域、車齡、里程數、車型、車系、外觀、內飾、車況等多達上百維的特征信息,並且這些特征存在著數據的部分缺失或特征間多重共線性的複雜關係,給二手車價格的預測模型帶來三大挑戰:模型預測的準確率、模型推理的計算效率、模型的可解釋性。雖然現有的機器學習技術如神經網路或梯度提升樹模型可以端到端地處理複雜特征,但車輛特征數據的複雜性使得此類方法不適合用於二手車價格的預測,已有的二手車估值模型準確率較低。為解決上述三個問題,本估值模型採用了分而治之的思路,將車源按照省份、城市和車型分組,再將分組後的車源數據中與時間相關的數據進行量化處理,根據相關性篩選特征,訓練多元線性回歸模型。
VR全景:現有的VR外觀技術方案是採用單反相機+長焦鏡頭拍攝,在自帶轉盤的影棚內進行車輛外觀的360°拍攝;或採用單反相機+魚眼鏡頭拍攝,車內使用單反進行4面拍攝,然後採用人工後期處理的方式完成全景360°圖像的生成。缺點在於單反+影棚+轉盤造價高,條件苛刻,拍攝車輛需要專人負責運輸,效率低,後期圖像處理繁瑣,產出一輛車的外觀+內飾圖片過程長,對於人員專業度要求苛刻。而通過手機APP引導拍攝+後期人工處理的方法所得圖像不夠精準,後期人工處理耗時長。二手車VR看車全新設計研發了基於模型、車輛輪廓識別、陀螺儀、磁場感測器綜合性的對被攝車輛和場地進行計算,給拍攝者提供便捷的定位拍攝方案。
車史檔案:維修保養記錄、碰撞記錄和電池充放電記錄的數據也同樣面臨著數據維度巨大、數據質量不一、缺乏規範化的問題。比如維保記錄和碰撞記錄,有著多種形式的數據來源,既有半結構化的記錄表單,也有記錄文檔,甚至還有拍攝或掃描的文檔圖像,需要對這些數據源進行加工處理,規範為統一格式的數據形式。在車況信息的抽取過程中,需要根據領域專家知識明確需要抽取的信息類型,建立車況評估和電池狀況評估的知識模型以及相應的標準化術語詞表,建立車況和電池的評分、評級模型。
圖片
實現方法
  • 估值
圖片圖3 估值模型 
對車輛進行估價,是二手車交易的重要環節,在交易過程中,需要根據車輛信息對二手車進行評估定價,獲得較為準確估價區間。目前,我們基於汽車之家的二手車車源數據研發了一種車輛估價模型,來滿足商家、用戶對二手車車源價格的評估。
我們的車輛估價模型主要使用的車源數據包括:地理區域、車型、行駛里程、上牌時間、發佈車輛時間等,首選我們需要車源數據中提取地理區域和車型,並按照地理區域、車型對車源數據中的其他維度數據進行分組,得到分組數據,再將分組後的車源數據中與時間相關的數據進行量化處理,處理後的各組車源數據作為訓練數據,訓練多元線性回歸模型,模型定義如下:
圖片
其中,Y為估價,θ0為截距,變數t1為上牌時間,變數t2為行駛里程,變數t3為用戶發佈車輛信息時間,θ1、θ2、θ3為對應的回歸繫數。
圖片表1 不同地理區域、不同車型對應估計模型的截距與回歸繫數
構建多個針對各個地理區域下的、不同車型的車輛估價模型,即每個省份對應多個車輛估價模型,每個省份、城市、車型下對應一個車輛估值模型。由於不同省份、車型的車輛價格存在一定的差異,因此針對不同地理區域、車型訓練不同的估值模型,可以有效減少預測誤差,使模型估計的準確性更高。得到針對各個地理區域下的、不同車型的截距與回歸繫數。
圖片
圖片
圖4 根據信息預測估值&歷史成交和建議
因此,本估值模型本質上是一個集成模型,頂層是按省份、城市和車型進行的分類模型,底層是對應類別的多個預測模型。當利用訓練得到的車輛估價模型進行估價時,首先根據從客戶端獲取的地理區域、車型,選擇與地理區域、車型相對應的車輛估價模型,再將從客戶端獲取的上牌時間、用戶發佈車輛信息時間、行駛里程輸入以選取的模型,模型輸出對應的高準確性的車輛估價。
  • VR全景
在VR技術逐漸普及,可為用戶提供新穎的內容展現形式的背景下。因二手車一車一況,通過VR技術採集商家各輛車的內外圖像數據,隨車輛信息發佈以後,可為用戶提供更加直觀、真實的車輛狀況展示,線上車源360°展現,外觀、內飾無死角細節瀏覽,提升瀏覽體驗。提高用戶決策及線索轉化,提升到店轉化率 。同時也為商家提供了高質線索和用戶到店率。  
圖片圖5  VR全景拍攝技術流程
拍攝方案:載入用戶選擇的對應年代款的車輛模型圖30張,一套360°外觀圖需要拍攝30張不同角度的照片,以車輛為圓心,12°為一個點,進行站位點劃分,站位點與模型圖角度進行強關聯,每張圖對應到一個站位點。使用手機內置陀螺儀+電子羅盤,經過計算可為拍攝者提供精準的角度位置信息,供拍攝者參考自身占位是否與模型圖匹配;通過圖像輪廓實時識別能力,為拍攝者提供精準的距離指引,免除人工丈量設置拍攝點位的繁瑣步驟;當拍攝者按下拍攝按鈕後,程式對拍攝的圖片進行分析識別,保留車輛輪廓內的車輛清晰圖片,對輪廓外的背景區域進行20%的高斯模糊圖層生成,並對邊緣進行羽化處理,拼合所有圖層,得到最終的一個角度的外觀圖。本外觀拍攝方案,簡化了人工圖像處理步驟,通過智能識別演算法,全自動生成預期的車輛清晰背景虛化的外觀圖片,極大地簡化了車輛外觀360°的拍攝流程,10分鐘內即可完成外觀和內飾拍攝,並直接上傳平臺展示。
圖片
圖6 VR全景多平臺一體化集成方案
適配多端拍看一體化技術方案(手機App拍攝 + App雙端VR播放組件 + H5VR播放組件):  1. 自研手機360°VR外觀拍攝App組件;2. 自研集成化內飾VR拍攝組件, 支持多品牌VR相機連接拍攝;3. 自研App原生外觀播放器控制項;4. 基於ThreeSixty二次研發的外觀H5播放器; 5. 基於Kpano的內飾360°H5內飾播放器。
  • 車史檔案
圖片
圖7 車史報告生成
圖片
圖8 部分車史報告示例
圖片
圖9 部分電池報告示例
車輛出險記錄,4S店維修保養記錄和天天拍線下檢測記錄數據形式多樣,部分圖片數據需要先通過OCR轉換為統一的文檔格式,再從文檔中抽取結構化的信息。首先建立車況評估和電池狀況評估的知識模型以及相應的標準化術語詞表,解決了哪些信息需要被抽取,信息彼此之間的關係是什麼,信息該如何利用的問題。具體來說,NLP模型抽取出時間信息,里程數、維修/理賠金額等數量信息,實體信息(汽車關鍵部位,如A柱、B柱等)及相應的方位詞(如正前方、前方左側等)和動詞(如切割、鈑金、焊接等),並根據句法標註建立實體、方位詞和動詞之間的關係,構成形如“左-A柱-焊接”的語義短語,這樣的語義短語是描述車輛碰撞維修歷史的最小語義單元。由於原始記錄的不規範或OCR識別過程中的誤差,記錄文檔對汽車關鍵部位的描述可能不夠準確或不夠完整,還需要依據預先建立的標準關鍵部位名詞詞表、動詞詞表、方位詞詞表進行規範化處理,得到標準化的關鍵部位名詞、動詞,以及相應的語義短語。
圖片
圖片
圖10 車況排查分類的知識模型 & 圖11:車史報告與VR圖像的語義對齊
根據檢測部位和事件類型,將車況排查分為骨架排查、加強件排查、水泡排查、火燒排查、里程排查、外觀部件、變速箱/發動機排查、安全氣囊排查8大維度。其中外觀部件的排查信息可以與VR圖像建立語義上的對齊,進而在VR層面進行視覺上的呈現。根據標準化的關鍵部位名詞與動詞關係,制定了不同維度的車況評級規則,將抽取出的標準化語義短語映射為“ABCD”四個等級評級,最後綜合8個維度的評級和車輛的出險記錄、理賠金額、新車指導價格等信息對車況做出綜合的評估,分為“優、良、中、差”四個等級。從抽取的語義短語、事件和數量信息生成車輛的碰撞歷史明細、維修保養歷史明細和歷史里程明細。
隨著新能源汽車市場的迅猛發展,汽車之家二手車也積累了數萬的新能源車源車主和對新能源車源有買車欲望的用戶。除了獲取車輛的維保、碰撞、里程車史,新能源車用戶還對電池性能和電池續航能力的評估有著強烈需求。為此,二手車聯合北理新源,利用新能源車電池大數據打造了新能源二手車智能車況雲平臺,將電池數據進行加工處理和評級,在汽車之家、二手車之家等相關產品上一鍵生成新能源電池一站式線上檢測報告,實現電池性能實時評估和續航里程線上檢測。
電池檢測報告記錄了電池出廠數據,並對電池評估數據、充放電數據、行駛數據和異常情況數據進行綜合排查評估電池性能,計算出參考續航里程。綜合解析以上維度的數據,構建了電池狀況評分和評級模型,預測電池性能的評分並按照評分劃分為優、良、中、差四個等級。

圖片結語

針對二手車車輛數據和視覺展示進行了深度探究,我們建立了標準化的數據處理加工流程、方法模型以及可視化展示形式。面對海量的複雜的車輛數據,以分治思想建立估值的集成模型,極大提高了估值的準確性,使用戶能夠準確瞭解當前車輛的價值;建立標準化的車史知識模型,通過演算法模型和規則方法將碰撞、維保、電池的信息結構化,特別是新能源車電池線上檢測報告,在業內處於創新領導地位。在視覺展示層面,創新地利用軟體技術解決了傳統VR技術過於依賴硬體和人力導致的成本偏高,時間偏長的問題,使商家能夠輕鬆地拍攝360°全景影像,提升購車用戶的瀏覽體驗。三個維度的信息經過數字技術解析並集成融合,重塑了二手車買車的業務數字化場景。
二手車買車業務是我們二手車非常關鍵的業務線,在用戶做出交易決策的過程中,可信且完善的車輛信息以及信息與用戶的交互起到至關重要的作用。汽車之家二手車的願景是持續推動業務的數字化轉型,打造二手車流通的全數字化系統,實現非標商品標準化,過程透明化,建立起一套賦能二手車行業數字化轉型的新模式。
作者|繆西安

本文來自博客園,作者:古道輕風,轉載請註明原文鏈接:https://www.cnblogs.com/88223100/p/Big-data_VR-panoramic-technology-reshapes-the-second-hand-car-buying-scene.html


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在AIX系統中,查看網卡配置可以使用entstat和lsdev命令來實現。 使用entstat命令查看網卡配置 使用以下命令查看所有網卡的信息: entstat -all 使用以下命令查看指定網卡的信息: entstat -d enX 其中enX代表網卡的名稱,例如en0表示第一塊網卡,en1表示第 ...
  • GPFS 文件系統部署步驟 參考文檔: 簡書網友提供: https://www.jianshu.com/p/a0ecc0838b3b?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendat ...
  • 首先可以直接改Hosts文件(現在不太管用了)。如果你是Linux或Mac系統,那麼可以通過命令sudo vim /etc/hosts打開Hosts文件併進行修改。如果你已經擁有了網路代理服務,那麼我們可以在此基礎上配置終端代理。我們查看得知自己代理伺服器的IP地址為http://127.0.0.1... ...
  • 鎖屏面試題百日百刷,每個工作日堅持更新面試題。請看到最後就能獲取你想要的,接下來的是今日的面試題: 1.請說明什麼是Apache Kafka? Apache Kafka是由Apache開發的一種發佈訂閱消息系統,它是一個分散式的、分區的和重覆的日誌服務。 2.請說明什麼是傳統的消息傳遞方法? 傳統的 ...
  • 解壓flume包 到/usr/local/src/目錄下 [root@hadoopha01 pack]# tar -zxvf apache-flume-1.7.0-bin.tar.gz -C /usr/local/src/ 配置flume環境變數 #FLUME_HOME export FLUME_H ...
  • GreatSQL社區原創內容未經授權不得隨意使用,轉載請聯繫小編並註明來源。 GreatSQL是MySQL的國產分支版本,使用上與MySQL一致。 作者: Yejinrong/葉金榮 文章來源:GreatSQL社區投稿 編譯GreatSQL 安裝gdb 開始調試GreatSQL源碼 3.1 利用gd ...
  • Redis 是一個高性能的鍵值存儲系統,支持多種數據結構。 包含五種基本類型 String(字元串)、Hash(哈希)、List(列表)、Set(集合)、Zset(有序集合),和三種特殊類型 Geo(地理位置)、HyperLogLog(基數統計)、Bitmaps(點陣圖)。 ...
  • 最近在閱讀《認知覺醒》這本書,裡面有句話非常打動我:通過自己的語言,用最簡單的話把一件事情講清楚,最好讓外行人也能聽懂。希望藉助今天這篇文章,能用大白話說清楚這個相對比較底層和複雜的MVCC機制 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...