diff --git a/ebook/build/Makefile b/ebook/build/Makefile index b0d0137d3..0f0fef03d 100644 --- a/ebook/build/Makefile +++ b/ebook/build/Makefile @@ -34,7 +34,7 @@ $(BUILD)/html/$(BOOKNAME).html: cp TAOP.png $(BUILD)/html @tmpdir=`pwd`;\ cd $(BUILD)/html;\ - mdtogh --css --user=$(GHUSER) --pass=$(GHPASS) --toc --book=$$tmpdir/book.json --file_reg='^\d.+\.md$$' $$tmpdir/$(SRC_DIR); + mdtogh --css --user=$(GHUSER) --pass=$(GHPASS) --toc --toc_file=$$tmpdir/$(SRC_DIR)Readme.md --book=$$tmpdir/book.json --file_reg='^\d.+\.md$$' $$tmpdir/$(SRC_DIR); $(BUILD)/pdf/$(BOOKNAME).pdf: $(TITLE) mkdir -p $(BUILD)/pdf diff --git a/ebook/zh/07.03.md b/ebook/zh/07.03.md index 57106eb92..727e0ebf2 100644 --- a/ebook/zh/07.03.md +++ b/ebook/zh/07.03.md @@ -82,7 +82,7 @@ Query统计有以下俩个方法,可供选择: 至此,算法就完全结束了,经过上述第一步、先用Hash表统计每个Query出现的次数,O(N);然后第二步、采用堆数据结构找出Top 10,N\*O(logK)。所以,我们最终的时间复杂度是:O(N) + N'\*O(logK)。(N为1000万,N’为300万)。如果各位有什么更好的算法,欢迎留言评论。 -此外,还可以看下此文第二部分的第二题:[教你如何迅速秒杀掉:99%的海量数据处理面试题](08.1.md) +此外,还可以看下此文第二部分的第二题:[教你如何迅速秒杀掉:99%的海量数据处理面试题](08.01.md) ##第二部分、Hash表 算法的详细解析 diff --git a/ebook/zh/08.01.md b/ebook/zh/08.01.md index 8ca979827..d0e24cdf4 100644 --- a/ebook/zh/08.01.md +++ b/ebook/zh/08.01.md @@ -316,7 +316,7 @@ Bloom filter将集合中的元素映射到位数组中,用k(k为哈希函数 * 关于数据库索引及其优化,更多可参见此文:; * 关于MySQL索引背后的数据结构及算法原理,这里还有一篇很好的文章:; -* 关于B 树、B+ 树、B* 树及R 树,本blog内有篇绝佳文章:[从B树、B+树、B*树谈到R 树](07.2.md)。 +* 关于B 树、B+ 树、B* 树及R 树,本blog内有篇绝佳文章:[从B树、B+树、B*树谈到R 树](07.02.md)。 **倒排索引(Inverted index)** @@ -349,9 +349,9 @@ Bloom filter将集合中的元素映射到位数组中,用k(k为哈希函数 关于倒排索引的应用,更多请参见: -* [第二十三章:杨氏矩阵查找](23.0.md), -* [第二十四章:倒排索引关键词Hash不重复编码实践](24.0.md) -* [第二十六章:基于给定的文档生成倒排索引的编码与实践](26.0.md)。 +* [第二十三章:杨氏矩阵查找](03.02.md), +* [第二十四章:倒排索引关键词Hash不重复编码实践](09.04.md) +* [第二十六章:基于给定的文档生成倒排索引的编码与实践](09.05.md)。 #### 密匙五、外排序 @@ -386,7 +386,7 @@ MapReduce是一种计算模型,简单的说就是将大批量的工作(数 更多具体阐述请参见blog内: -* [从Hadhoop框架与MapReduce模式中谈海量数据处理](08.2.md), +* [从Hadhoop框架与MapReduce模式中谈海量数据处理](08.02.md), * 及[MapReduce技术的初步了解与学习](http://blog.csdn.net/v_july_v/article/details/6637014)。 **其它模式/方法论,结合操作系统知识**