最近接到一个任务,领导让比对两个 excel 文件中指定列的数据,如果有一样的,筛选出来整理到新的 excel 中,由于需要对比的文件有几十个,每个文件的数据量还很大,所以,就想到用脚本处理,于是整理了如下笔记。
安装 xlsx 插件:
npm install xlsx
创建 operateExcel.js 文件:
//引入 xlsx 插件
const xlsx = require('xlsx')
/**
* 读取excel中的数据,并以json格式输出
* @param {string} filePath 文件所在路径
*/
function readFile(filePath){
const fileContent = xlsx.readFile(filePath); // 读取excel文件
const name = fileContent.SheetNames[0] // 获取excel第一张sheet的名字
const sheet = fileContent.Sheets[name] // 获取excel第一张sheet中的数据
const jsonData = xlsx.utils.sheet_to_json(sheet) // 将数据转成 json 格式
return jsonData
}
/**
* 将json数据写入并生成excel文件
* @param {string} filePath 路径
* @param {Array} jsonData 数据
* @param {string} sheetName 表格名字, 默认 Sheet1
*/
function writeFile(filePath, jsonData, sheetName='Sheet1'){
const excleBook = xlsx.utils.book_new() // 新建文件
xlsx.utils.book_append_sheet(excleBook, xlsx.utils.json_to_sheet(jsonData), sheetName); // 向文件中添加sheet,并将数据写入sheet
xlsx.writeFile(excleBook, filePath); // 输出文件
}
const jsonData = readFile('C:/Users/xxxx/Desktop/test/test.xlsx')
writeFile('C:/Users/xxxx/Desktop/test/test01.xlsx',jsonData)
test.xlsx 文件如图:
在node环境下,在 operateExcel.js 文件所在目录打开cmd命令窗口,执行如下命令,即可运行:
node operateExcel.js
调用 readFile 函数输出 json 数据如图:
调用 writeFile 方法,将 test.xlsx 中读取的 json 数据写入并生成到 test01.xlsx 文件中,结果如图:
下面是比对文件完整示例:
//引入 xlsx 插件
const xlsx = require('xlsx')
/**
* 读取excel中的数据,并以json格式输出
* @param {string} filePath 文件所在路径
*/
function readFile(filePath){
const fileContent = xlsx.readFile(filePath); // 读取excel文件
const name = fileContent.SheetNames[0] // 获取excel第一张sheet的名字
const sheet = fileContent.Sheets[name] // 获取excel第一张sheet中的数据
const jsonData = xlsx.utils.sheet_to_json(sheet) // 将数据转成 json 格式
return jsonData
}
/**
* 将json数据写入并生成excel文件
* @param {string} filePath 路径
* @param {Array} jsonData 数据
* @param {string} sheetName 表格名字, 默认 Sheet1
*/
function writeFile(filePath, jsonData, sheetName='Sheet1'){
// 新建文件
const excleBook = xlsx.utils.book_new()
// 向文件中添加sheet,并将数据写入sheet
xlsx.utils.book_append_sheet(excleBook, xlsx.utils.json_to_sheet(jsonData), sheetName);
xlsx.writeFile(excleBook, filePath); // 输出文件
}
//读取test01文件中的数据
const jsonData01 = readFile('C:/Users/xxxx/Desktop/test/test01.xlsx')
//读取test02文件中的数据
const jsonData02 = readFile('C:/Users/xxxx/Desktop/test/test02.xlsx')
//通过遍历jsonData01,获取test01文件中的姓名列的数据,这里idArr是姓名列的数据组成的数组
const idArr=jsonData01.map(v=>v['姓名'])
//这里将文件test02与test01中的姓名列进行对比,如果文件test02中的姓名在文件test01中,则筛选出来
const newJsonData = jsonData02.filter(v=>idArr.includes(v['姓名']))
//生成test文件,并将筛选出来的数据写入到test文件中
writeFile('C:/Users/xxxx/Desktop/test/test.xlsx',newJsonData)