有些命令工作中经常用到,记录在一个文章里用于查阅,本文经常更新。 shell命令 linux统计某个目录下所有文件的行数的命令 find /home/crazyant -type f -name "*" | xargs cat | wc -l 用find查找crazyant目录下所有文本文件的行数之和。不过该命令执行挺慢
有些命令工作中经常用到,记录在一个文章里用于查阅,本文经常更新。
shell命令
linux统计某个目录下所有文件的行数的命令
find /home/crazyant -type f -name "*" | xargs cat | wc -l
用find查找crazyant目录下所有文本文件的行数之和。不过该命令执行挺慢的。
linux统计某个目录下所有目录和总目录的大小命令
du -h --max-depth=1 /home/crazyant/
统计crazyant目录下的所有文件的大小,这里我只想看到一层目录的大小,因此加上了—max-depth=1如果不加这个参数,该命令会以递归的方式列出所有子目录的文件大小
scp命令的使用:
从本地复制到远程:scp -r ?logs_jx pss@crazyant.net/home/pss/logs
hive命令
hive建立和执行索引
create index table02_index on table table02(id) as 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler' with deferred rebuild; alter index table02_index on table02 rebuild;
第一句hive在表上建立了索引但没有生效,第二句真正的执行建立索引的过程,其本身也是一个map –reduce过程。
hive的Load data命令
hive -e " use crazyant_net; LOAD DATA INPATH '/app/crazyant/student/*' INTO TABLE student;"
其中inpath的意思是input path的意思,所以不管是从本地local还是hdfs上load data,都要带上。
hadoop命令
hadoop的distcp命令带用户名密码的方法
hadoop distcp -su user1,pass1 -du user1,pass1 hdfs://src1 hdfs://dest1
有时候两个集群之间是没有distcp权限的,这时候需要带上两个集群的账号密码,在-su后面带上第一个集群的账号密码,在-du后面带上目标集群的账号密码。
Mysql命令
?查看数据表的最详细的字段描述信息
SHOW FULL FIELDS FROM student
该命令把注释、权限、默认值、类型等表字段信息都列出来了。
查看正在执行的mysql线程
mysql> show processlist; +———+———–+——————–+————-+———+——+——-+——————+ | Id????? |??? User?? | Host?????????????? | db????????? | Command | Time | State | Info???????????? | +———+———–+——————–+————-+———+——+——-+——————+ | 2153201 | crazyant? | 127.0.0.1:25357??? | pulse?????? | Sleep?? |? 914 |?????? | NULL???????????? | | 2153733 | crazyant? | 127.0.0.1:48814??? | hive??????? | Query?? |??? 0 | NULL? | show processlist | | 2153735 | crazyant? | 127.0.0.1:39639??? | pulse?????? | Sleep?? |?? 13 |?????? | NULL???????????? | | 2153736 | crazyant? | 127.0.0.1:39640??? | pulse?????? | Sleep?? |?? 13 |?????? | NULL???????????? | +———+———–+——————–+————-+———+——+——-+——————+ 4 rows in set (0.01 sec) mysql>
使用kill命令可以把其中的一个进程给删了
mysql> kill 2153474;
Query OK, 0 rows affected (0.00 sec)
将数据LOAD到MYSQL的方法:
篇文章是针对git版本控制和工作流的总结,如果有些朋友之前还没使用过git,对git的基本概念和命令不是很熟悉,可以从以下基本教程入手: Git是分布式版本控制系统,与SVN类似的集中化版本控制系统相比,集中化版本控制系统虽然能够令多个团队成员一起协作开发,但有时如果中央服务器宕机的话,谁也无法在宕机期间提交更新和协同开发。甚至有时,中央服务器磁盘故障,恰巧又没有做备份或备份没及时,那就可能有丢失数据的风险。感兴趣的朋友可以过来看看
LOAD DATA LOCAL INFILE ‘D:/workbench/python/result.txt’ REPLACE INTO TABLE my_urlvisit FIELDS TERMINATED BY’\t’ LINES TERMINATED BY’\n’ IGNORE 0 LINES (url,pdate,COUNT);
vim命令
如果编辑错误,按ESC回到命令模式,按u可以撤销刚才的编辑;
vim编辑中文文本出现乱码
VIM的文本经常会出现中文乱码,这是因为fileencoding和termencoding编码不一致造成的,设置一直就可以了;
:set termencoding
termencoding=cp936
:set fileencoding
fileencoding=utf-8
:set termencoding=utf8
这样设置一下vim就能正常显示中文了;
转载请注明来源:http://www.crazyant.net/1209.html









