使用Excel OleDb来获取表格名称

我使用OleDb从Excel工作簿中读取很多工作表。

我需要阅读工作表名称,但是我需要他们在电子表格中定义的顺序; 所以如果我有一个这样的文件,

|_____|_____|____|____|____|____|____|____|____| |_____|_____|____|____|____|____|____|____|____| |_____|_____|____|____|____|____|____|____|____| \__GERMANY__/\__UK__/\__IRELAND__/ 

然后我需要得到字典

 1="GERMANY", 2="UK", 3="IRELAND" 

我试过使用OleDbConnection.GetOleDbSchemaTable() ,这给了我名单的名单,但它按字母顺序sorting他们。 阿尔法sorting意味着我不知道一个特定的名字对应的纸张编号。 所以我得到

 GERMANY, IRELAND, UK 

这改变了UKIRELAND的秩序。

我需要对它进行sorting的原因是我必须让用户通过名称或索引来select一个范围的数据; 他们可以要求“从德国到爱尔兰的所有数据”或“从表格1到表格3的数据”。

任何想法将不胜感激。

如果我可以使用办公室interop类,这将是直接的。 不幸的是,我不能这样做,因为互操作类在非交互式环境(如windows服务和ASP.NET网站)中不能可靠地工作,所以我需要使用OLEDB。

在实际的MSDN文档中找不到这个,但在论坛中的主持人说

恐怕OLEDB不能像Excel一样保存图表顺序

工作表顺序中的Excel工作表名称

似乎这将是一个共同的足够的要求,将有一个体面的解决方法。

你能不能循环遍历从0到名称-1的计数? 这样你应该把它们按正确的顺序。

编辑

我通过注释注意到,使用Interop类来检索表单名称有许多担忧。 因此,下面是使用OLEDB检索它们的示例:

 /// <summary> /// This method retrieves the excel sheet names from /// an excel workbook. /// </summary> /// <param name="excelFile">The excel file.</param> /// <returns>String[]</returns> private String[] GetExcelSheetNames(string excelFile) { OleDbConnection objConn = null; System.Data.DataTable dt = null; try { // Connection String. Change the excel file to the file you // will search. String connString = "Provider=Microsoft.Jet.OLEDB.4.0;" + "Data Source=" + excelFile + ";Extended Properties=Excel 8.0;"; // Create connection object by using the preceding connection string. objConn = new OleDbConnection(connString); // Open connection with the database. objConn.Open(); // Get the data table containg the schema guid. dt = objConn.GetOleDbSchemaTable(OleDbSchemaGuid.Tables, null); if(dt == null) { return null; } String[] excelSheets = new String[dt.Rows.Count]; int i = 0; // Add the sheet name to the string array. foreach(DataRow row in dt.Rows) { excelSheets[i] = row["TABLE_NAME"].ToString(); i++; } // Loop through all of the sheets if you want too... for(int j=0; j < excelSheets.Length; j++) { // Query each excel sheet. } return excelSheets; } catch(Exception ex) { return null; } finally { // Clean up. if(objConn != null) { objConn.Close(); objConn.Dispose(); } if(dt != null) { dt.Dispose(); } } } 

从CodeProject上的文章中提取。

由于上面的代码不包括为Excel 2007提取表名称列表的过程,因此以下代码同时适用于Excel(97-2003)和Excel 2007:

 public List<string> ListSheetInExcel(string filePath) { OleDbConnectionStringBuilder sbConnection = new OleDbConnectionStringBuilder(); String strExtendedProperties = String.Empty; sbConnection.DataSource = filePath; if (Path.GetExtension(filePath).Equals(".xls"))//for 97-03 Excel file { sbConnection.Provider = "Microsoft.Jet.OLEDB.4.0"; strExtendedProperties = "Excel 8.0;HDR=Yes;IMEX=1";//HDR=ColumnHeader,IMEX=InterMixed } else if (Path.GetExtension(filePath).Equals(".xlsx")) //for 2007 Excel file { sbConnection.Provider = "Microsoft.ACE.OLEDB.12.0"; strExtendedProperties = "Excel 12.0;HDR=Yes;IMEX=1"; } sbConnection.Add("Extended Properties",strExtendedProperties); List<string> listSheet = new List<string>(); using (OleDbConnection conn = new OleDbConnection(sbConnection.ToString())) { conn.Open(); DataTable dtSheet = conn.GetOleDbSchemaTable(OleDbSchemaGuid.Tables, null); foreach (DataRow drSheet in dtSheet.Rows) { if (drSheet["TABLE_NAME"].ToString().Contains("$"))//checks whether row contains '_xlnm#_FilterDatabase' or sheet name(ie sheet name always ends with $ sign) { listSheet.Add(drSheet["TABLE_NAME"].ToString()); } } } return listSheet; } 

上述函数都返回exceltypes(97,2003,2007)特别是excel文件列表。

其他方式:

xls(x)文件只是存储在* .zip容器中的* .xml文件的集合。 解压缩docProps文件夹中的文件“app.xml”。

 <?xml version="1.0" encoding="UTF-8" standalone="true"?> -<Properties xmlns:vt="http://schemas.openxmlformats.org/officeDocument/2006/docPropsVTypes" xmlns="http://schemas.openxmlformats.org/officeDocument/2006/extended-properties"> <TotalTime>0</TotalTime> <Application>Microsoft Excel</Application> <DocSecurity>0</DocSecurity> <ScaleCrop>false</ScaleCrop> -<HeadingPairs> -<vt:vector baseType="variant" size="2"> -<vt:variant> <vt:lpstr>Arbeitsblätter</vt:lpstr> </vt:variant> -<vt:variant> <vt:i4>4</vt:i4> </vt:variant> </vt:vector> </HeadingPairs> -<TitlesOfParts> -<vt:vector baseType="lpstr" size="4"> <vt:lpstr>Tabelle3</vt:lpstr> <vt:lpstr>Tabelle4</vt:lpstr> <vt:lpstr>Tabelle1</vt:lpstr> <vt:lpstr>Tabelle2</vt:lpstr> </vt:vector> </TitlesOfParts> <Company/> <LinksUpToDate>false</LinksUpToDate> <SharedDoc>false</SharedDoc> <HyperlinksChanged>false</HyperlinksChanged> <AppVersion>14.0300</AppVersion> </Properties> 

该文件是一个德国文件(Arbeitsblätter=工作表)。 表名(Tabelle3等)是正确的顺序。 你只需要阅读这些标签;)

问候

我使用@kraeppy( https://stackoverflow.com/a/19930386/2617732 )答案中提供的信息创build了以下函数。 这需要使用.net framework v4.5并需要对System.IO.Compression的引用。 这只适用于xlsx文件,而不适用于较旧的xls文件。

  using System.IO.Compression; using System.Xml; using System.Xml.Linq; static IEnumerable<string> GetWorksheetNamesOrdered(string fileName) { //open the excel file using (FileStream data = new FileStream(fileName, FileMode.Open)) { //unzip ZipArchive archive = new ZipArchive(data); //select the correct file from the archive ZipArchiveEntry appxmlFile = archive.Entries.SingleOrDefault(e => e.FullName == "docProps/app.xml"); //read the xml XDocument xdoc = XDocument.Load(appxmlFile.Open()); //find the titles element XElement titlesElement = xdoc.Descendants().Where(e => e.Name.LocalName == "TitlesOfParts").Single(); //extract the worksheet names return titlesElement .Elements().Where(e => e.Name.LocalName == "vector").Single() .Elements().Where(e => e.Name.LocalName == "lpstr") .Select(e => e.Value); } } 

我喜欢@deathApril的想法,将这些表格命名为1_Germany,2_UK,3_IRELAND。 我也有你的问题做这个重命名为数百张。 如果你没有问题来重命名表名,那么你可以使用这个macros为你做。 重命名所有工作表名称将需要不到几秒的时间。 不幸的是,ODBC,OLEDB通过asc返回表单名称顺序。 没有替代品。 您必须使用COM或将您的名字重命名为顺序。

 Sub Macro1() ' ' Macro1 Macro ' ' Dim i As Integer For i = 1 To Sheets.Count Dim prefix As String prefix = i If Len(prefix) < 4 Then prefix = "000" ElseIf Len(prefix) < 3 Then prefix = "00" ElseIf Len(prefix) < 2 Then prefix = "0" End If Dim sheetName As String sheetName = Sheets(i).Name Dim names names = Split(sheetName, "-") If (UBound(names) > 0) And IsNumeric(names(0)) Then 'do nothing Else Sheets(i).Name = prefix & i & "-" & Sheets(i).Name End If Next End Sub 

更新:阅读@SidHoland有关BIFF的意见后,一个想法闪过。 以下步骤可以通过代码完成。 不知道你是否真的想这样做,以同样的顺序获取表名。 让我知道如果你需要帮助,通过代码来做到这一点。

 1. Consider XLSX as a zip file. Rename *.xlsx into *.zip 2. Unzip 3. Go to unzipped folder root and open /docprops/app.xml 4. This xml contains the sheet name in the same order of what you see. 5. Parse the xml and get the sheet names 

更新:另一个解决scheme – NPOI可能会有所帮助http://npoi.codeplex.com/

  FileStream file = new FileStream(@"yourexcelfilename", FileMode.Open, FileAccess.Read); HSSFWorkbook hssfworkbook = new HSSFWorkbook(file); for (int i = 0; i < hssfworkbook.NumberOfSheets; i++) { Console.WriteLine(hssfworkbook.GetSheetName(i)); } file.Close(); 

这个解决scheme适用于xls。 我没有尝试xlsx。

谢谢,

也先

这对我有效。 从这里被盗: 你如何得到一个Excel工作簿的第一页的名字?

  object opt = System.Reflection.Missing.Value; Excel.Application app = new Microsoft.Office.Interop.Excel.Application(); Excel.Workbook workbook = app.Workbooks.Open(WorkBookToOpen, opt, opt, opt, opt, opt, opt, opt, opt, opt, opt, opt, opt, opt, opt); Excel.Worksheet worksheet = workbook.Worksheets[1] as Microsoft.Office.Interop.Excel.Worksheet; string firstSheetName = worksheet.Name; 

尝试这个。 以下是按顺序获取图纸名称的代码。

  private Dictionary<int,string> GetExcelSheetNames(string fileName) { Excel.Application _excel = null; Excel.Workbook _workBook = null; Dictionary<int,string> excelSheets = new Dictionary<int,string>(); try { object missing = Type.Missing; object readOnly = true; Excel.XlFileFormat.xlWorkbookNormal _excel = new Excel.ApplicationClass(); _excel.Visible = false; _workBook = _excel.Workbooks.Open(fileName, 0, readOnly, 5, missing, missing, true, Excel.XlPlatform.xlWindows, "\\t", false, false, 0, true, true, missing); if (_workBook != null) { int index = 0; foreach (Excel.Worksheet sheet in _workBook.Sheets) { // Can get sheet names in order they are in workbook excelSheets.Add(++index, sheet.Name); } } } catch (Exception e) { return null; } finally { if (_excel != null) { if (_workBook != null) { _workBook.Close(false, Type.Missing, Type.Missing); } _excel.Application.Quit(); } _excel = null; _workBook = null; } return excelSheets; } 

根据MSDN,如果Excel中的电子表格可能无法正常工作,因为Excel文件不是真正的数据库。 因此,您将无法按工作簿中的可视化顺序获取表单名称。

使用interop获取表单名称的代码:

添加对Microsoft Excel 12.0对象库的引用。

以下代码将按工作簿中存储的实际顺序提供工作表名称,而不是按sorting的名称。

示例代码:

 using Microsoft.Office.Interop.Excel; string filename = "C:\\romil.xlsx"; object missing = System.Reflection.Missing.Value; Microsoft.Office.Interop.Excel.Application excel = new Microsoft.Office.Interop.Excel.Application(); Microsoft.Office.Interop.Excel.Workbook wb =excel.Workbooks.Open(filename, missing, missing, missing, missing,missing, missing, missing, missing, missing, missing, missing, missing, missing, missing); ArrayList sheetname = new ArrayList(); foreach (Microsoft.Office.Interop.Excel.Worksheet sheet in wb.Sheets) { sheetname.Add(sheet.Name); } 

我没有看到任何说明app.xml中的顺序保证是表单顺序的文档。 它可能是,但不符合OOXML规范。

另一方面,workbook.xml文件包含sheetId属性,该属性确定序列 – 从1到表的数量。 这是根据OOXML规范。 workbook.xml被描述为保存表单序列的地方。

因此,从XLSX中解压缩后读取workbook.xml将是我的build议。 不是app.xml。 而不是docProps / app.xml,使用xl / workbook.xml并查看元素,如下所示 –

`

 <workbook xmlns="http://schemas.openxmlformats.org/spreadsheetml/2006/main" xmlns:r="http://schemas.openxmlformats.org/officeDocument/2006/relationships"> <fileVersion appName="xl" lastEdited="5" lowestEdited="5" rupBuild="9303" /> <workbookPr defaultThemeVersion="124226" /> - <bookViews> <workbookView xWindow="120" yWindow="135" windowWidth="19035" windowHeight="8445" /> </bookViews> - <sheets> <sheet name="By song" sheetId="1" r:id="rId1" /> <sheet name="By actors" sheetId="2" r:id="rId2" /> <sheet name="By pit" sheetId="3" r:id="rId3" /> </sheets> - <definedNames> <definedName name="_xlnm._FilterDatabase" localSheetId="0" hidden="1">'By song'!$A$1:$O$59</definedName> </definedNames> <calcPr calcId="145621" /> </workbook> 

`