《UNIX环境高级编程》 文件

Linux中所有的 I/O 设备都被抽象为文件,这样所有的输入输出都被当作对相应的文件进行读写操作。这种将设备统一映射为文件的方式,允许Linux内核引出一个简单、低级的应用接口,称为 Unix I/O, 使得所有的输入输出都能以一种统一的方式执行。

poi解析Excel(三) XML定义解析规则

相对于普通文本,Excel可以将表格数据描述得更结构化,它可以用不同的sheet存放不同的数据,并且在sheet中可指定各个字段的列头,在单元格中可以设置数据类型或格式校验。如果解析时能将这些结构信息利用并且支持可配,那么对解析处理将会有一些帮助

poi解析Excel(二) SAX解决内存问题

由于Excel的数据是通过xml来描述,所以解析Excel也就是解析xml。对于文本文件,可以通过换行符来确定一行的结束。而对于xml,其描述数据的单位是节点,并且可以嵌套,因此读取时是以节点结束来进行确定,但是除非事先知道xml的节点规则,即节点相互之间的嵌套结构,否则无法正确读取。这个xml规则就定义在Excel的规范中,poi也是基于这个规则来对Excel进行解析的

poi解析Excel(一) 实现readLine读取

读取文本时通常会使用BufferedReader,它在InputStreamReader的基础上进行装饰,提供了readLine()来简化文本行的读取。使得行数据的读取可以像流水线一样,每当读取完一行后,它就自动准备好下一行并等待获取,直至全部读取结束。所以这里也希望能够在poi的基础上提供一个类似readLine()的接口来读取Excel,并可以比较方便地获取行数据中的字段。

算法 TopK问题

这里考虑一个具体问题:有大约40万个数字(数字范围:0~200000000000000),数字没有重复,求这些数字中,最大的100个数字之和