一.UTF8字元集csv文件在oracle下亂碼問題處理

-Advertisement-

1.問題描述在excel中生成了一個UTF-8編碼格式的csv文件準備導入資料庫，在notpad++下打開顯示正常，編碼集為UTF-8，通過pl/sql dev導入oracle是出現亂碼，此時初步推斷oracle字元集與本地操作不同導致的亂碼 2.處理過程 2.1 查看ORACLE字元編碼集 se ...

1.問題描述

在excel中生成了一個UTF-8編碼格式的csv文件準備導入資料庫，在notpad++下打開顯示正常，編碼集為UTF-8，通過pl/sql dev導入oracle是出現亂碼，此時初步推斷oracle字元集與本地操作不同導致的亂碼

2.處理過程

2.1 查看ORACLE字元編碼集

select userenv('language') from dual;

此時oracle返回其字元編碼為：SIMPLIFIED CHINESE_CHINA.ZHS16GBK

2.2 添加操作系統對象字元編碼系統變數

在win10中添加如下系統變數

變數名:NLS_LANG

變數值:SIMPLIFIED CHINESE_CHINA.ZHS16GBK

2.3 更改文件字元集

2.3.1 excle

從excle導出的csv文件只能直接導出為utf-8格式，暫未發現有其他方法可以直接導出其他字元編碼類型的csv文件

2.3.2 notpad++

在notpad++中直接通過編碼->轉換為GB2312（notpad++沒有gbk，gbk是GB2312的超集）,結果文件出現亂碼，此方法不可行；

在notpad++中新建一個空文件，將其字元編碼集變為gb2312，再將原來csv文件的內容複製過來，發現沒有出現亂碼，且字元編碼集設置成功

2.3.3 sublime

使用sublime 安裝ConvertToUTF8 插件可以實現編碼集轉換

安裝過程：ctr+shift+p打開完成搜索框，輸入install package 打開可安裝插件列表界面，在此界面輸入ConvertToUTF8 可直接安裝該插件

使用方法：打開UTF編碼集的csv文件，點擊file->relaod with encoding,在其中選擇目標字元編碼，這裡我們選中gbk，點擊之後，文件已轉化為gbk編碼，再保存即可

2.3.4 java編寫工具類

 1 public void codeChange() throws IOException {
 2         String sourceCharset = "utf8"; // 源文件編碼
 3         String targetCharset = "gbk"; // 目標文件編碼
 4         String newFileName=path.substring(0,path.lastIndexOf("."))+"_"+1+".csv";
 5         File file =new File(path);//源文件
 6         FileInputStream fileInputStream=new FileInputStream(file);
 7         InputStreamReader inputStreamReader=new InputStreamReader(fileInputStream,sourceCharset);
 8         BufferedReader bufferedReader=new BufferedReader(inputStreamReader);
 9         File targetFile =new File(newFileName);//目標文件
10         BufferedWriter bufferedWriter=new BufferedWriter(new OutputStreamWriter(new FileOutputStream(targetFile),targetCharset));
11         String line=null;
12         while((line=bufferedReader.readLine())!=null){
13             bufferedWriter.write(line);
14             bufferedWriter.newLine();
15             bufferedWriter.flush();
16         }
17         bufferedWriter.close();
18         bufferedReader.close();
19     }

2.4 註意事項

2.4.1 在利用notpad++或sublime更改字元集時，最好先對文件進行備份，因為編碼轉化可能是不可逆過程

2.4.2 一般遇到字元編碼不統一，修改一方即可，這裡我們選擇修改操作系統的是因為避免對其他文件造成影響，也可以選擇修改oracle的字元編碼集，但是對資料庫中其他數據會造成影響

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

mysql之存儲過程

本文內容：什麼是存儲過程存儲過程的創建存儲過程的使用查看存儲過程修改存儲過程刪除存儲過程首發日期：2018-04-17 什麼是存儲過程：存儲過程存儲了一系列sql語句存儲過程的需求場景：下邊是一個經典的需求場景，很多Mysql的書都有：存儲過程存儲了一系列sql語句，使得簡化了操 ...
SQL Server 有序GUID，SequentialGuid，

問題描述有序的GUID性能對比，堪比自增ID integer 一個大神告訴我NEWSEQUENTIALID() 在數據遷移的時候會有問題(感謝大神指點)，所以我就深挖一下這個函數。關於NEWSEQUENTIALID() 的用法參照 NEWSEQUENTIALID() NEWSEQUENTIAL ...
MongoDB 主從和Replica Set

目前主要的MongoDB高可用架構包含：主從架構 Replica set副本集方式 sharding分片註意：使用高可用架構後ips，qps相比單實例都會有一定程度的下降，其中rs下降不是他太明顯，但是sharding下降的程度比較高。本文不討論sharding，在另一篇博客中單獨描述了sha ...
連接mysql資料庫報錯java.sql.SQLException: The server time zone value '�й��׼ʱ��' is unrecognized...解決方法

今天連接mysql資料庫報錯如下：配置文件中：解決方法：修改配置文件內容：在配置 spring.datasource.url 的時候加上後面的配置就可以了版權聲明：本文為博主原創文章，未經博主允許不得轉載。 http://www.cnblogs.com/tangyin/p/8864890. ...
MySQL各類SQL語句的加鎖機制

官網參考：https://dev.mysql.com/doc/refman/5.6/en/innodb-locks-set.html MySQL把讀操作分為兩大類：鎖定讀和非鎖定讀（即locking read和nonlocking read），所謂非鎖定讀就是不對錶添加事務鎖的讀操作，如Repeat ...
MongoDB 副本集複製

MongoDB是當下比較流行的NoSQL 資料庫.提供了副本集複製應對數據的可擴展性，可靠性及提供了隔離性. 下麵講講一般情況下的副本集複製的配置。 1.環境 Centos 7MongoDB 3.6 2.機器配置 IP hostname port path is arbiter 192.168.11 ...
MySQL鎖機制

本文參考自MySQL官網5.6版本參考手冊的14.5.1,此小節說明MySQL的鎖分類，此外還有14.5.2小節和14.5.3小節詳述事務隔離級別和各SQL語句的加鎖模式，後兩節將單獨寫2篇筆記。 https://dev.mysql.com/doc/refman/5.6/en/innodb-lock ...
利用MySql之sql導出帶備註的表結構

SELECT COLUMN_NAME 列名, COLUMN_TYPE 數據類型, DATA_TYPE 欄位類型, CHARACTER_MAXIMUM_LENGTH 長度, IS_NULLABLE 是否為空, COLUMN_DEFAULT 預設值, COLUMN_COMMENT 備註 FROM INF ...