準確的問題描述和適合問題數據的演算法選擇

来源:https://www.cnblogs.com/lwyeah/archive/2018/03/16/8584668.html
-Advertisement-
Play Games

對磁碟文件進行排序,文件包含最多一千萬條記錄,每條記錄都是7位的整數,無其他相關數據,每個整數只出現一次,由於某種系統需要,只能提供1MB左右記憶體。由於是實時系統,最多運行幾分鐘就能給出回應,十秒鐘是比較理想的運行時間。 準確的問題描述: 輸入:一個包含n個正整數的文件,每個數都小於n,其中n=10 ...


對磁碟文件進行排序,文件包含最多一千萬條記錄,每條記錄都是7位的整數,無其他相關數據,每個整數只出現一次,由於某種系統需要,只能提供1MB左右記憶體。由於是實時系統,最多運行幾分鐘就能給出回應,十秒鐘是比較理想的運行時間。

準確的問題描述:

輸入:一個包含n個正整數的文件,每個數都小於n,其中n=10 000 000。如果在輸入文件中出現兩個相同的整數就是致命錯誤。沒有其他數據與該整數相關。

輸出:按照升序輸出的文件

約束:大約有1MB的記憶體空間可用,有充足的的磁碟空間,運行時間達到十秒以內不需要優化。


可以利用bit向量來表示整數集合,例如8bit長的維向量{0,0,1,1,0,1,0,1},可以表示1-8的整數集合{3,4,6,8}

因此

1、初始化bit向量為全0  2、讀取磁碟數據i,並賦值bit[i] = 1  3、掃描bit向量,if ( bit[i] == 1) print i

可行性:1MB = 1024 x 1024 x 8bit = 8388608bit,在大概1.25MB的條件下,就能夠將所有數據採用bit向量完成表示

 

 1 #include <stdio.h>
 2 #define arrSpace 262144
 3 int arr[arrSpace];
 4 char fileName[20];
 5 
 6 void init(){
 7     int i;
 8     for(i=0; i < arrSpace; i++){
 9         arr[i] = 0;
10     }
11 }
12 
13 int main(void){
14     int n;
15     int i,j;
16     
17     scanf("%s",fileName);
18     FILE *in = fopen(fileName,"r");
19     FILE *out = fopen("outSort.txt","w");
20     
21     while(fscanf(in, "%d", &n) != EOF){
22         arr[n/32] = arr[n/32] | (1<<(n%32));
23     }
24 
25     for(i=0; i<arrSpace; i++){
26         for(j=0; j<32; j++){
27             if((arr[i] & (1<<j)) != 0){
28                 fprintf(out,"%d\n",i * 32 + j);       
29             }
30         }
31     }
32    
33    fclose(in);
34    fclose(out);
35 }

 

c語言中int類型占據32bit,因此262144長度的int數組為1MB

通過對讀取的數據i對32求商和求餘的運算,例如60/32=1,60%32=28,則應該把數組arr[1]的第28個bit置位1(一個int為0-31bit)

因此將整數1(int型)左移28位並與arr[1]進行邏輯或運算,可以將對應的bit置1

在最後輸出的時候將1左移0-31位,並與arr做邏輯與運算如果結果為1,則說明數據中存在這個整數,將數據按照遍歷順序輸出到文件就完成任務。

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Python unicode轉義字元\u的處理 python還有更為專業的方法來解決unicode轉義字元問題,那就是unicode escape編碼。 s = s2.decode("unicode escape") 就可以了 ...
  • 創建了一個一維向量和三行散列的矩陣 註意:這裡要求數據是同一結構,shape函數作用:幾行幾列 取值: 修改矩陣中的值: 這裡把5和7的值改成了10 強轉類型: 把int型轉為str型 其他操作: 矩陣初始化: 創建矩陣: 運算: 排序: 特別註意: 讀取txt文件: ...
  • 項目簡介 在慕課網上發現了一個JavaWeb項目,內容講的是高併發秒殺,覺得挺有意思的,就進去學習了一番。 記錄在該項目中學到了什麼玩意.. 該項目源碼對應的gitHub地址(由觀看其視頻的人編寫,並非視頻源代碼): "https://github.com/codingXiaxw/seckill" ...
  • 1.使用if語句進行最基本的條件測試;2.測試一個值大於還是小於另一個值;3.測試兩個值是否相等;4.使用與if語句對應的else語句;5.組合多個條件測試;6.使用switch語句進行複雜的條件測試;7.使用三元運算符創建測試; 程式Game:if語句的初步使用 1 package com.jsa ...
  • 眾所周知python中單引號和雙引號常常被我們所使用,例如print、input等等。 但是對於列印輸出所引導的字元串大多都是用雙引號的形式來做,"Hello,python!",而單引號多(三個單引號)是用來註釋代碼用。 我們一旦遇到了 包含多個單引號和雙引號的字元串的話,系統就會自動判定引號節點, ...
  • 在學習Spring Aop時,遇到一個問題,當 @Around(環繞通知)與 @AfterReturning(後置通知)共存 時,@AfterReturning 通過屬性 returning = "var" 獲取目標方法的返回值時結果總為null,如下: 介面代碼: 目標類代碼: 切麵代碼: 運行結 ...
  • “Hello World”,這大概是每個程式員最熟悉的一句話了吧。每每我們進入一種語言的世界,第一句話就是向它問好。仔細想來,也許這就是我們的一種態度,一種出於習慣的禮貌,或者說是一種出於禮貌的問候吧。“世界,你好!”。短短的一句話,意味著從那一刻起,我們便正式進入了某一種語言的世界,所以也可以說是 ...
  • 實驗結論 題目1:輸入 1~7 的整數,如果輸入的是 1~5,則輸出“workday. Let’s work hard”;如果輸入的是 6~7,則輸出“weekend. Let’s have a rest.” 源代碼(1)及運行結果 源代碼(2)及運行結果 題目2:輸入一個整數,將各位數字反轉後輸出 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...