亚洲欧美精品沙发,日韩在线精品视频,亚洲Av每日更新在线观看,亚洲国产另类一区在线5

<pre id="hdphd"></pre>

  • <div id="hdphd"><small id="hdphd"></small></div>
      學(xué)習(xí)啦 > 學(xué)習(xí)電腦 > 操作系統(tǒng) > Linux教程 > 如何快速刪除Linux文件中的重復(fù)數(shù)據(jù)行

      如何快速刪除Linux文件中的重復(fù)數(shù)據(jù)行

      時(shí)間: 孫勝652 分享

      如何快速刪除Linux文件中的重復(fù)數(shù)據(jù)行

        Linux系統(tǒng)操作中,如果文件中的數(shù)據(jù)過(guò)多,想要?jiǎng)h除重復(fù)數(shù)據(jù)行是非常麻煩的,查找不方便,那么有什么方法能夠快速刪除文件重復(fù)數(shù)據(jù)行呢?下面學(xué)習(xí)啦小編就給大家介紹下如何刪除文件重復(fù)數(shù)據(jù)行,一起來(lái)看看吧。

        一、去掉相鄰重復(fù)的數(shù)據(jù)行

        代碼如下:

        $cat data1.txt | uniq

        輸出:

        beijing

        wuhan

        beijing

        wuhan

        二、去掉所有重復(fù)的數(shù)據(jù)行

        代碼如下:

        $cat data1.txt | sort | uniq

        注:

        只有uniq命令的話,只是把相鄰的重復(fù)的數(shù)據(jù)行去掉。

        如果先 sort 的話,就會(huì)把所有重復(fù)的數(shù)據(jù)行變成相鄰的數(shù)據(jù)行,再 uniq 的話,就去掉所有重復(fù)的數(shù)據(jù)行了。

        輸出:

        beijing

        wuhan

        附:data1.txt

        代碼如下:

        [root@syy ~]# cat data1.txt

        beijing

        beijing

        wuhan

        wuhan

        wuhan

        beijing

        beijing

        beijing

        wuhan

        wuhan

        注:在過(guò)濾日志中的IP地址很有用。

        Linux下刪除大數(shù)據(jù)文件中部分字段重復(fù)的行

        最近寫的一個(gè)數(shù)據(jù)采集程序生成了一個(gè)含有1千多萬(wàn)行數(shù)據(jù)的文件,數(shù)據(jù)由4個(gè)字段組成,按照要求需要?jiǎng)h除第二個(gè)字段重復(fù)的行,找來(lái)找去linux下也沒找到合適的工具,sed/gawk等流處理工具只能針對(duì)一行一行處理,并無(wú)法找到字段重復(fù)的行??磥?lái)只好自己python一個(gè)程序了,突然想起來(lái)利用mysql,于是進(jìn)行乾坤大挪移:

        1. 利用mysqlimport --local dbname data.txt導(dǎo)入數(shù)據(jù)到表中,表名要與文件名一致

        2. 執(zhí)行下列sql語(yǔ)句(要求唯一的字段為uniqfield)

        代碼如下:

        use dbname;

        alter table tablename add rowid int auto_increment not null;

        create table t select min(rowid) as rowid from tablename group by uniqfield;

        create table t2 select tablename .* from tablename,t where tablename.rowid= t.rowid;《/p》 《p》drop table tablename;

        rename table t2 to tablename;

        上面就是Linux刪除文件重復(fù)數(shù)據(jù)行的方法介紹了,本文介紹了多種情況下刪除文件重復(fù)數(shù)據(jù)行的方法,希望對(duì)你有所幫助。

      312214