本筆記摘抄自:https://www.cnblogs.com/liqingwen/p/5816051.html,記錄一下學習過程以備後續查用。 許多文件系統操作實質上是查詢,因此非常適合使用LINQ方法。 一、查詢具有指定屬性或名稱的文件 此示例演示如何查找指定目錄樹中具有指定文件擴展名(例如“.t ...
本筆記摘抄自:https://www.cnblogs.com/liqingwen/p/5816051.html,記錄一下學習過程以備後續查用。
許多文件系統操作實質上是查詢,因此非常適合使用LINQ方法。
一、查詢具有指定屬性或名稱的文件
此示例演示如何查找指定目錄樹中具有指定文件擴展名(例如“.txt”)的所有文件,還演示如何根據創建時間返回樹中最新或最舊的文件。
class Program { static void Main(string[] args) { #region LINQ 查詢具有指定屬性或名稱的文件 //文件路徑 const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\"; //取文件系統快照 var dir = new DirectoryInfo(path); //該方法假定應用程式在指定路徑下的所有文件夾都具有搜索許可權 var files = dir.GetFiles("*.*", SearchOption.AllDirectories); //創建查詢 var qurey = from file in files where file.Extension == ".txt" orderby file.Name select file; //執行查詢 foreach (var file in qurey) { Console.WriteLine(file.FullName); } //創建和執行一個新的查詢,通過查詢舊文件的創建時間作為一個出發點。 //Last:選擇最後一個,因為是按日期升序,所以最新的是指向最後一個。 var newestFile = (from file in qurey orderby file.CreationTime select new { file.FullName, file.CreationTime }).Last(); Console.WriteLine($"\r\nThe newest .txt file is {newestFile.FullName}. Creation time: {newestFile.CreationTime}"); Console.Read(); #endregion } }View Code
運行結果如下:
二、按照擴展名對文件進行分組
此示例演示如何使用LINQ對文件或文件夾列表執行高級分組和排序操作。此外,它還演示如何使用Skip<TSource>和Take<TSource>方法對控制台窗
口中的輸出進行分頁。
下麵的查詢演示如何按文件擴展名對指定目錄樹的內容進行分組。
class Program { static void Main(string[] args) { #region LINQ 按照擴展名對文件進行分組 const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\Enterprise\Common7\"; //“path”的長度,後續用於在輸出時去掉“path”這段首碼。 var trimLength = path.Length; //取文件系統快照 var dir = new DirectoryInfo(path); //該方法假定應用程式在指定路徑下的所有文件夾都具有搜索許可權。 var files = dir.GetFiles("*.*", SearchOption.AllDirectories); //創建查詢 var query = from file in files group file by file.Extension.ToLower() into fileGroup orderby fileGroup.Key select fileGroup; //一次顯示一組。如果列表實體的行數大於控制台視窗中的行數,則分頁輸出。 PageOutput(trimLength, query); #endregion } /// <summary> /// 分頁輸出 /// </summary> /// <param name="rootLength"></param> /// <param name="query"></param> private static void PageOutput(int rootLength, IOrderedEnumerable<IGrouping<string, FileInfo>> query) { //跳出分頁迴圈的標誌 var isAgain = true; //控制台輸出的高度 var numLines = Console.WindowHeight - 3; //遍歷分組集合 foreach (var g in query) { var currentLine = 0; do { Console.Clear(); Console.WriteLine(string.IsNullOrEmpty(g.Key) ? "[None]" : g.Key); //從“currentLine”開始顯示“numLines”條數 var resultPage = g.Skip(currentLine).Take(numLines); //執行查詢 foreach (var info in resultPage) { Console.WriteLine("\t{0}", info.FullName.Substring(rootLength)); } //記錄輸出行數 currentLine += numLines; Console.WriteLine("點擊“任意鍵”繼續,按“End”鍵退出"); //給用戶選擇是否跳出 var key = Console.ReadKey().Key; if (key != ConsoleKey.End) continue; isAgain = false; break; } while (currentLine < g.Count()); if (!isAgain) { break; } } } }View Code
運行結果如下:
三、查詢一組文件夾中的總位元組數
此示例演示如何檢索指定文件夾及其所有子文件夾中的所有文件所使用的總位元組數。
Sum方法添加在select子句中選擇的所有項的值。您可以輕鬆修改此查詢以檢索指定目錄樹中的最大或最小文件,方法是調用Min<TSource>或
Max<TSource>方法,而不是Sum。
class Program { static void Main(string[] args) { #region LINQ 查詢一組文件夾中的總位元組數 const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\"; var dir = new DirectoryInfo(path); var files = dir.GetFiles("*.*", SearchOption.AllDirectories); var query = from file in files select file.Length; //緩存結果,以避免多次訪問文件系統 var fileLengths = query as long[] ?? query.ToArray(); //返回最大文件的大小 var largestLength = fileLengths.Max(); //返回指定文件夾下的所有文件中的總位元組數 var totalBytes = fileLengths.Sum(); Console.WriteLine(); Console.WriteLine("There are {0} bytes in {1} files under {2}", totalBytes, files.Count(), path); Console.WriteLine("The largest files is {0} bytes.", largestLength); Console.Read(); #endregion } }View Code
運行結果如下:
四、比較兩個文件夾中的內容
此示例演示比較兩個文件列表的三種方法:
1、查詢一個指定兩個文件列表是否相同的布爾值。
2、查詢用於檢索同時位於兩個文件夾中的文件的交集。
3、查詢用於檢索位於一個文件夾中但不在另一個文件夾中的文件的差集。
/// <summary> /// 文件名和位元組數比較類 /// </summary> public class FileComparer : IEqualityComparer<FileInfo> { public bool Equals(FileInfo x, FileInfo y) { return string.Equals(x.Name, y.Name, StringComparison.CurrentCultureIgnoreCase) && x.Length == y.Length; } //返回一個比較標準的哈希值。根據IEqualityComparer規則,如果相等,那麼哈希值也必須是相等的。 //因為這裡所定義的相等只是一個簡單的值相等,而不是引用標識,所以兩個或多個對象將產生相同的哈希值是可能的。 public int GetHashCode(FileInfo obj) { var s = string.Format("{0}{1}", obj.Name, obj.Length); return s.GetHashCode(); } } class Program { static void Main(string[] args) { #region LINQ 查詢一組文件夾中的總位元組數 const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\"; var dir = new DirectoryInfo(path); var files = dir.GetFiles("*.*", SearchOption.AllDirectories); var query = from file in files select file.Length; //緩存結果,以避免多次訪問文件系統 var fileLengths = query as long[] ?? query.ToArray(); //返回最大文件的大小 var largestLength = fileLengths.Max(); //返回指定文件夾下的所有文件中的總位元組數 var totalBytes = fileLengths.Sum(); Console.WriteLine(); Console.WriteLine("There are {0} bytes in {1} files under {2}", totalBytes, files.Count(), path); Console.WriteLine("The largest files is {0} bytes.", largestLength); Console.Read(); #endregion } }View Code
運行結果如下:
此處顯示的FileComparer類演示如何將自定義比較器類與標準查詢運算符一起使用。該類不是為在實際方案中使用而設計的,它只是使用每個
文件的名稱和長度(以位元組為單位)來確定每個文件夾的內容是否相同。在實際方案中,應對此比較器進行修改以執行更嚴格的相等性檢查。
五、在目錄樹中查詢最大的文件
此示例演示與文件大小(以位元組為單位)相關的五種查詢:
1、如何檢索最大文件的大小(以位元組為單位)。
2、如何檢索最小文件的大小(以位元組為單位)。
3、如何從指定的根文件夾下的一個或多個文件夾檢索FileInfo對象最大或最小文件。
4、如何檢索一個序列,如10個最大文件。
下麵的示例包含五種不同的查詢,這些查詢演示如何根據文件大小(以位元組為單位)查詢和分組文件。可以輕鬆地修改這些示例,以使查詢基
於FileInfo對象的某個其他屬性。
class Program { static void Main(string[] args) { #region LINQ 在目錄樹中查詢最大的文件 const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\"; var dir = new DirectoryInfo(path); var files = dir.GetFiles("*.*", SearchOption.AllDirectories); var query1 = from file in files select file.Length; //返回最大文件的大小 var maxSize = query1.Max(); Console.WriteLine("The length of the largest file under {0} is {1}", path, maxSize); Console.WriteLine(); //倒序排列 var query2 = from file in files let len = file.Length where len > 0 orderby len descending select file; var fileInfos = query2 as FileInfo[] ?? query2.ToArray(); //倒序排列的第一個就是最大的文件 var longestFile = fileInfos.First(); //倒序排列的第一個就是最小的文件 var smallestFile = fileInfos.Last(); Console.WriteLine("The largest file under {0} is {1} with a length of {2} bytes", path, longestFile.FullName, longestFile.Length); Console.WriteLine(); Console.WriteLine("The smallest file under {0} is {1} with a length of {2} bytes", path, smallestFile.FullName, smallestFile.Length); Console.WriteLine(); Console.WriteLine("===== The 10 largest files under {0} are: =====", path); //返回前10個最大的文件 var queryTenLargest = fileInfos.Take(10); foreach (var file in queryTenLargest) { Console.WriteLine("{0}: {1} bytes", file.FullName, file.Length); } Console.Read(); #endregion } }View Code
運行結果如下:
若要返回一個或多個完整的FileInfo對象,查詢必須首先檢查數據源中的每個對象,然後按這些對象的Length屬性的值排序它們,這樣就可以
返回具有最大長度的單個對象或序列。使用 First<TSource>可返回列表中的第一個元素使用 Take<TSource>可返回前n個元素。
六、在目錄樹中查詢重覆的文件
有時,多個文件夾中可能存在同名的文件。例如,在Visual Studio安裝文件夾中,有多個文件夾包含readme.htm文件。
此示例演示如何在指定的根文件夾中查詢重覆文件名。
class Program { static void Main(string[] args) { #region LINQ 在目錄樹中查詢重覆的文件示例一 const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\"; var dir = new DirectoryInfo(path); var files = dir.GetFiles("*.*", SearchOption.AllDirectories); var charsToSkip = path.Length; var queryDupNames = (from file in files group file.FullName.Substring(charsToSkip) by file.Name into fileGroup where fileGroup.Count() > 1 select fileGroup).Distinct(); PageOutput(queryDupNames); #endregion } /// <summary> /// 分頁輸出 /// </summary> /// <typeparam name="TK"></typeparam> /// <typeparam name="TV"></typeparam> /// <param name="queryDupNames"></param> private static void PageOutput<TK, TV>(IEnumerable<IGrouping<TK, TV>> queryDupNames) { //控制台輸出的高度 var numLines = Console.WindowHeight - 3; var dupNames = queryDupNames as IGrouping<TK, TV>[] ?? queryDupNames.ToArray(); foreach (var queryDupName in dupNames) { //分頁開始 var currentLine = 0; do { Console.Clear(); Console.WriteLine("Filename = {0}", queryDupName.Key.ToString() == string.Empty ? "[none]" : queryDupName.Key.ToString()); //跳過currentLine行,取numLines行。 var resultPage = queryDupName.Skip(currentLine).Take(numLines); foreach (var fileName in resultPage) { Console.WriteLine("\t{0}", fileName); } //增量器記錄已顯示的行數 currentLine += numLines; //按得有點累,還是讓它自動下一頁吧。 Thread.Sleep(100); } while (currentLine < queryDupName.Count()); } } }View Code
運行結果如下:
此示例演示如何查詢其大小和創建時間也匹配的文件。
/// <summary> /// PortableKey類 /// </summary> public class PortableKey { public string Name { get; set; } public DateTime CreationTime { get; set; } public double Length { get; set; } } class Program { static void Main(string[] args) { #region LINQ 在目錄樹中查詢重覆的文件示例二 const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\"; var dir = new DirectoryInfo(path); var files = dir.GetFiles("*.*", SearchOption.AllDirectories); var charsToSkip = path.Length; //註意一個複合鍵的使用,三個屬性都匹配的文件屬於同一組。 //匿名類型也可以用於複合鍵,但不能跨越方法邊界。 var queryDupFiles = from file in files group file.FullName.Substring(charsToSkip) by new PortableKey() { Name = file.Name, CreationTime = file.CreationTime, Length = file.Length } into fileGroup where fileGroup.Count() > 1 select fileGroup; var queryDupNames = queryDupFiles as IGrouping<PortableKey, string>[] ?? queryDupFiles.ToArray(); var list = queryDupNames.ToList(); var count = queryDupNames.Count(); //分頁輸出 PageOutput(queryDupNames); Console.Read(); #endregion } /// <summary> /// 分頁輸出 /// </summary> /// <typeparam name="TK"></typeparam> /// <typeparam name="TV"></typeparam> /// <param name="queryDupNames"></param> private static void PageOutput<TK, TV>(IEnumerable<IGrouping<TK, TV>> queryDupNames) { //控制台輸出的高度 var numLines = Console.WindowHeight - 3; var dupNames = queryDupNames as IGrouping<TK, TV>[] ?? queryDupNames.ToArray(); foreach (var queryDupName in dupNames) { //分頁開始 var currentLine = 0; do { Console.Clear(); Console.WriteLine("Filename = {0}", queryDupName.Key.ToString() == string.Empty ? "[none]" : queryDupName.Key.ToString()); //跳過currentLine行,取numLines行。 var resultPage = queryDupName.Skip(currentLine).Take(numLines); foreach (var fileName in resultPage) { Console.WriteLine("\t{0}", fileName); } //增量器記錄已顯示的行數 currentLine += numLines; //按得有點累,還是讓它自動下一頁吧。 Thread.Sleep(100); } while (currentLine < queryDupName.Count()); } } }View Code
七、在文件夾中查詢文件的內容
此示例演示如何查詢指定目錄樹中的所有文件、打開每個文件並檢查其內容。 此類技術可用於對目錄樹的內容創建索引或反向索引。 此示例
雖然執行的是簡單的字元串搜索,但是,可使用正則表達式執行更複雜類型的模式匹配。
class Program { static void Main(string[] args) { #region LINQ 在文件夾中查詢文件的內容 const string path = @"C:\Program Files (x86)\Microsoft Visual Studio\2017\"; var dir = new DirectoryInfo(path); var files = dir.GetFiles("*.*", SearchOption.AllDirectories); //待匹配的字元串 const string searchTerm = @"Visual Studio"; //搜索每個文件的內容。 //您也可以使用正則表達式替換Contains方法 var queryMatchingFiles = from file in files where file.Extension == ".html" let content = GetFileConetnt(file.FullName) where content.Contains(searchTerm) select file.FullName; //執行查詢 Console.WriteLine("The term \"{0}\" was found in:", searchTerm); foreach (var filename in queryMatchingFiles) { Console.WriteLine(filename); } Console.Read(); #endregion } /// <summary> /// 讀取文件的所有內容 /// </summary> /// <param name="fileName"></param> /// <returns></returns> static string GetFileConetnt(string fileName) { //如果我們在快照後已刪除該文件,則忽略它,並返回空字元串。 return File.Exists(fileName) ? File.ReadAllText(fileName) : ""; } }View Code
運行結果如下: