NPOI導出Excel及使用問題 因為最近公司質管部門提出了一個統計報表的需求:要求導出一個2016及2017年度深圳區域的所有供應商的費用成本計算——一個22列的Excel表,其中還包括多列的合併單元格;說實話,統計報表功能其實我還是很少涉及的,以前都是直接用DataTable+輸出流導出Exce ...
NPOI導出Excel及使用問題
因為最近公司質管部門提出了一個統計報表的需求:要求導出一個2016及2017年度深圳區域的所有供應商的費用成本計算——一個22列的Excel表,其中還包括多列的合併單元格;說實話,統計報表功能其實我還是很少涉及的,以前都是直接用DataTable+輸出流導出Excel,因為涉及到合併單元格,明顯用輸出流就不合適了,此時NPOI開源框架就很合適了;當然還有其他組件可以選擇,比如EPPlush,微軟自帶組件,以及收費的Aspose.Cells;因為NPOI資料比較多且公司用的組件也是這個,所以就選擇它了;
一步一步按需導出
由於這個功能因為查詢出來的數據量很大需要單獨抽離出來(不能放到公司的系統上),所以我就新建了一個控制台應用程式,簡單的做了一個導出Excel的功能,因為剛開始需求沒要求需要合併單元格,所以我這邊就很快的做出來了:核心代碼如下:
ExportToExcelByNOPI(dt, GetOriginColumns(dt), $"2016年度成本費用統計.xlsx"));
private void DataTableToExcel(DataTable dt, string[] titles, string file)
{
using (FileStream fs = new FileStream(file, FileMode.OpenOrCreate))
using (StreamWriter sw = new StreamWriter(new BufferedStream(fs), Encoding.Default))
{
string title = "";
//拼接表頭
for (int i = 0; i < dt.Columns.Count; i++)
{
title += titles[i] + "\t";//自動跳到下一單元格
}
title = title.Substring(0, title.Length - 1) + "\n";
sw.Write(title);
foreach (DataRow row in dt.Rows)
{
string line = "";
for (int i = 0; i < dt.Columns.Count; i++)
{
//line += row[i].ToString().Trim() + "\t"; //內容:自動跳到下一單元格
line += row[i].ToString().Trim() + "\t";//自動跳到下一單元格
}
line = line.Substring(0, line.Length - 1) + "\n";
sw.Write(line);
}
}
}
把導出的excel發過去發現根本不符合他們的要求,說要對哪些行合併單元格,這樣有利於他們數據分析,這樣的話就得NPOI上場了;剛開始想法很簡單,只要他們的值相等,我就把他合併單元格,畢竟像訂單號是唯一的麽,那麼訂單號所附帶的如訂單重量,數量等都是相同的(其實還是想的太當然了,導致了後面的一系列的問題)
private void ExportToExcelByNOPI(DataTable dt, string title, string strFilename)
{
if ((dt == null) || string.IsNullOrEmpty(strFilename))
{
return;
}
if (File.Exists(strFilename))
{
File.Delete(strFilename);
}
//添加表頭
for (int i = 0; i < dt.Columns.Count; i++)
{
ICell cell = headerrow.CreateCell(i);
cell.CellStyle = style;
cell.SetCellValue(dt.Columns[i].ColumnName);
}
//添加第一行數據
IRow row = sheet.CreateRow(1);
for (int j = 0; j < dt.Columns.Count; j++)
{
string cellText = dt.Rows[0][j].ToString();
row.CreateCell(j).SetCellValue(cellText);
}
//從第二行開始迴圈,和上一行進行判斷,如果相同,則合併
for (int i = 1; i < dt.Rows.Count; i++)
{
row = sheet.CreateRow(i + 1);
for (int j = 0; j < dt.Columns.Count; j++)
{
string cellText = dt.Rows[i][j].ToString();
row.CreateCell(j).SetCellValue(cellText);
string temp = dt.Rows[i - 1][j].ToString();
//這裡是合併單元格條件判斷,如值是否相等,是否在合併列要求之內
if (!string.IsNullOrEmpty(temp) && cellText== temp && ColumnsName.Contains(dt.Columns[j].ColumnName))
{
CellRangeAddress region = new CellRangeAddress(i, i+1, j, j);
sheet.AddMergedRegion(region);
}
}
}
style.Alignment = HorizontalAlignment.Center;
style.VerticalAlignment = VerticalAlignment.Center;
style.Alignment = HorizontalAlignment.Center;//居中顯示
using (FileStream fs = new FileStream(strFilename, FileMode.Open, FileAccess.ReadWrite))
using (MemoryStream ms = new MemoryStream())
{
workbook.Write(ms);
var buf = ms.ToArray();
fs.Write(buf, 0, buf.Length);
fs.Flush();
}
}
導出來發現Excel裡面合併之後的內容不對了,有的合併單元格不對(比如訂單號是01,有兩個產品P1,P2,這就有兩行,如果這兩行訂單號是相同的,則按需求是要合併的,但是其他列的值有的合併多了,稍微一細想就知道原因了,我只是單純的比較上一行與下一行的列值,那麼下一行的其它訂單的產品信息如規格,值相同的話也會被合併,這就不符合我們的要求了,所以還得在這個基礎之上在加限制條件;
因為這個表是已訂單為維護的,那麼我們就以這列為參照合併規則來記錄這列被合併的行數,然後我們標記這個行數記為sameCount
,那麼每列的值我們都會比較,如果在sameCount
行列值相同,則合併;那麼就得寫個輔助類CellCalculateHelper
來計算出要求被合併的列在sameCount
行值是否都相同:
internal class CellCalculateHelper
{
/// <summary>
/// 從startRow行開始比較相同訂單號的行數
/// </summary>
internal static (int startRow, int sameCount) GetRepeaterCount(int startRow, DataTable dt)
{
var i = startRow;
var sameCount = 0;
while (dt.Rows[startRow][0].ToString() == dt.Rows[i][0].ToString())
{
if ((i + 1) == dt.Rows.Count) break;
sameCount++;
i++;
}
return (startRow, sameCount);
}
internal static bool IsMergeRegionMaxRepeatCount(DataTable dt, string columnName, int startRow, int sameCount)
{
var start = startRow + sameCount - 1;
while (sameCount - 1 != 0)
{
if (dt.Rows[start][columnName].ToString() == dt.Rows[start - 1][columnName].ToString()){
start = start - 1;
sameCount--;
}else{
return false;
}
}
return true;
}
}
有了這個幫助類,就好辦了,改造上面的ExportToExcelByNOPI
方法如下:
private void ExportToExcelByNOPI(DataTable dt, string title, string strFilename)
{
...
//添加第一行數據這樣上面代碼相同
//記住第一行相同的最大行數
var tuple = CellCalculateHelper.GetRepeaterCount(0, dt);
//第一行數據遍歷
for (int i = 0; i < dt.Rows.Count; i++){
IRow row = sheet.CreateRow(i + 1);
//如果當前行數等於最大相同的函數(相當於合併之後的下一行數據,必定與上一行數據不同)
if (i == tuple.startRow + tuple.sameCount){
tuple = CellCalculateHelper.GetRepeaterCount(i, dt);
}
//遍歷列
for (int j = 0; j < dt.Columns.Count; j++){
string cellText = dt.Rows[i][j].ToString();
row.CreateCell(j).SetCellValue(cellText);
if (tuple.sameCount > 1){
//需要合併
string tempValue = dt.Rows[i][j].ToString();
//指定列合併單元格
if (!string.IsNullOrWhiteSpace(tempValue) &&
cellText == tempValue &&
ColumnsName.Contains(dt.Columns[j].ColumnName)){
//判斷是否是參照行DDNO
if (i >= tuple.startRow + tuple.sameCount - 1) continue;
if ((ColumnsName[0] == dt.Columns[j].ColumnName)){
//下一行與上一行合併
CellRangeAddress region = new CellRangeAddress(i + 1, i + 2, j, j);
sheet.AddMergedRegion(region);
}else{
//判斷該列的最大sameCount行值是否相同,如果不同,不合併;相同則合併
if (CellCalculateHelper.IsMergeRegionMaxRepeatCount(dt, dt.Columns[j].ColumnName, i, tuple.sameCount)){
CellRangeAddress region = new CellRangeAddress(i + 1, i + 2, j, j);
sheet.AddMergedRegion(region);
}
}
}
}
}
}
...
...
}
這樣導出來的數據就是正確符合業務同事的要求了!
後記
寫到這裡以為這些都是一帆風順的嗎?
NO!
我被坑在一個奇怪的地方,至今我也沒想到原因:期初,我是用控制台應用程式想簡單的導出excel的,也測試了從資料庫查出一個供應商的所有訂單信息導出excel是沒問題的,於是當我查詢出所有的供應商的時候,bug出現了,程式運行一段時間後毫無反應了(並不是死機,也沒有報記憶體溢出的錯誤),因為數據量很大,所以當時我還跟個煞筆似的在那裡等結束,等我吃完中飯回來發現還是沒有成功導出,我就意識到不對了,但是不報任何異常,我根本查不到問題現在那,我接著嘗試換種寫法導出excel——分頁,以及分批次導出不同的excel;這種是可以的,到這我心裡就知道估計是記憶體問題了,最後我把整個控制台項目換成類庫,然後新建web應用程式能一次運行成功,更加讓我堅信是記憶體問題,但是為什麼控制台應用程式不會報記憶體溢出的錯呢?這個我真的無從查起啊,有朋友知道,希望能告訴我
2017年12月29日修補:
前面修改之後還是不對,由於數據量太大,我在看了前部分的數據沒問題因為就OK,實際上問題還是比較明顯的,就是當有2個以上相同的數據列時,合併單元格就會有問題,原來我想的是H1,H2合併成為H21,然後繼續迴圈H3,接著合併,我以為H21與H3合併會成為一個在Excel中三行一列組成的合併單元格,但是結果發現是H3與H4合併之後在與H21拼接的兩個2行1列的單元格,這就有大問題,後來我就把合併單元格條件部分修正如下,便完美了。代碼如下:
//判斷是否是參照行OrdNO
if (i > tuple.startRow + tuple.sameCount - 1) continue;
//新增的i == tuple.startRow 是為了防止多次合併
if ((ColumnsName[0] == sourceTable.Columns[j].ColumnName) && i == tuple.startRow)
{
//startRow與startRow+sameCount行合併(也就是一次性合併相同行數單元格)
CellRangeAddress region = new CellRangeAddress(tuple.startRow + 1, tuple.startRow + tuple.sameCount, j, j);
sheet.AddMergedRegion(region);
}else
{
if (CellCalculateHelper.IsMergeRegionMaxRepeatCount(sourceTable, sourceTable.Columns[j].ColumnName, tuple.startRow, tuple.sameCount) && i == tuple.startRow)
{
CellRangeAddress region = new CellRangeAddress(tuple.startRow + 1, tuple.startRow + tuple.sameCount, j, j);
sheet.AddMergedRegion(region);
}
}