首页 1 2 3 4 5 6 7

大文件重复行

假如有一个文件很大，比如1T，现在需要找出内容重复的行。如果用java代码来实现，用缓存肯定是不行的，一般的服务器没有这么多内存。那么如何去做呢？可以利用数据库来处理，方法如下。
创建一个表，有两列，一个是id主键，表示行号，一列是内容content。
-- Create table
create table T_HUGE_FILE
(
ID number,
CONTENT varchar2(1000)
)
;
-- Create/Recreate primary, unique and foreign key constraints
alter table T_HUGE_FILE
add constraint PK_T_HUGE_FILE primary key (ID);

逐行读取文件并保持到数据库中。
然后通过sql语句查询出重复的行及内容。
select id, content from t_huge_file where id not in
(select min(id) from t_huge_file group by content)

ASR PRO与 ESP8266 CP2102进行串口通信

接线方法 ESP8266ASR PRORXPB5TXPB

学习Dubbo，这一篇文章就够了

分布式RPC框架Apache Dubbo 1. 软件架构的演进过程软件架构的发展经历了由单体架构、垂直架构、SOA架构到微服务架构的演进过程，下面我们分别了解一下这几个架构

android6.0新建项目中appcompat_v7导入问题以及导入的项目xml问题

本人最近深受其折磨，项目导到公司出错，从公司倒回来有出错。最后索性杠上了，找了半天终于找到几个靠谱的，就不在盗别人的了，上连接导包解决问题：

Tensorflow笔记--搭建卷积神经网络

卷积计算过程隐藏层过多，待训练的参数过多时，可能会造成模型的过拟合，可以利用卷积计算来提取图像特征，从而避免过拟合，提高模型的泛化能力。卷积计算时，卷积核的深度需要和输入特征图的深度匹配(相等)。卷积核里存在待训练的参数，在进行反向

angular.js笔记 ---关于Tabs切换

正在CodeShcool上学习angular.js，记录一点自己觉得可以记录的东西，方便以后查看

Python 求补码

# # 由十进制得到二进制补码

Magento计划任务定时执行cron.sh脚本文件 / 执行.php文件

每5分钟执行一次 cron.sh文件 */5 * * * * /bin/sh /var/www/html/cron.sh 每天凌晨4点执行某个.php文件

dart 引入库、第三方库

系统内置库 import 'dart:math' import 'dart:io' import 'dart:convert' Pub包管理系统中的库需要取flutter库中查找所需要的库,按文档下载使用使用: 1、根目录创建pubspec.yaml,并配

计算几何——关于凸包的graham算法的实现并将其可视化，以及一个问题希望大神能解答

graham算法是先要对顶点进行预处理：首先通过找到起始点LTL，然后其他点按照与起始点间极角的大小排序。

js中split的应用 jq获取数值

var stuKey = stuKey.split(',');//用分割符把字符串切割为数组 eg: var test = "a,b,c,d"; var arrtest = test.split(','); arrtest = array(0 =&