Skip to content

Commit

Permalink
fix errro link in 07.03.md & 08.01.md, modify html generate options
Browse files Browse the repository at this point in the history
  • Loading branch information
marchtea committed Mar 11, 2014
1 parent d5bfcd1 commit 370ad0c
Show file tree
Hide file tree
Showing 3 changed files with 7 additions and 7 deletions.
2 changes: 1 addition & 1 deletion ebook/build/Makefile
Original file line number Diff line number Diff line change
Expand Up @@ -34,7 +34,7 @@ $(BUILD)/html/$(BOOKNAME).html:
cp TAOP.png $(BUILD)/html
@tmpdir=`pwd`;\
cd $(BUILD)/html;\
mdtogh --css --user=$(GHUSER) --pass=$(GHPASS) --toc --book=$$tmpdir/book.json --file_reg='^\d.+\.md$$' $$tmpdir/$(SRC_DIR);
mdtogh --css --user=$(GHUSER) --pass=$(GHPASS) --toc --toc_file=$$tmpdir/$(SRC_DIR)Readme.md --book=$$tmpdir/book.json --file_reg='^\d.+\.md$$' $$tmpdir/$(SRC_DIR);

$(BUILD)/pdf/$(BOOKNAME).pdf: $(TITLE)
mkdir -p $(BUILD)/pdf
Expand Down
2 changes: 1 addition & 1 deletion ebook/zh/07.03.md
Original file line number Diff line number Diff line change
Expand Up @@ -82,7 +82,7 @@ Query统计有以下俩个方法,可供选择:

至此,算法就完全结束了,经过上述第一步、先用Hash表统计每个Query出现的次数,O(N);然后第二步、采用堆数据结构找出Top 10,N\*O(logK)。所以,我们最终的时间复杂度是:O(N) + N'\*O(logK)。(N为1000万,N’为300万)。如果各位有什么更好的算法,欢迎留言评论。

此外,还可以看下此文第二部分的第二题:[教你如何迅速秒杀掉:99%的海量数据处理面试题](08.1.md)
此外,还可以看下此文第二部分的第二题:[教你如何迅速秒杀掉:99%的海量数据处理面试题](08.01.md)


##第二部分、Hash表 算法的详细解析
Expand Down
10 changes: 5 additions & 5 deletions ebook/zh/08.01.md
Original file line number Diff line number Diff line change
Expand Up @@ -316,7 +316,7 @@ Bloom filter将集合中的元素映射到位数组中,用k(k为哈希函数

* 关于数据库索引及其优化,更多可参见此文:<http://www.cnblogs.com/pkuoliver/archive/2011/08/17/mass-data-topic-7-index-and-optimize.html>
* 关于MySQL索引背后的数据结构及算法原理,这里还有一篇很好的文章:<http://blog.codinglabs.org/articles/theory-of-mysql-index.html>
* 关于B 树、B+ 树、B* 树及R 树,本blog内有篇绝佳文章:[从B树、B+树、B*树谈到R 树](07.2.md)
* 关于B 树、B+ 树、B* 树及R 树,本blog内有篇绝佳文章:[从B树、B+树、B*树谈到R 树](07.02.md)

**倒排索引(Inverted index)**

Expand Down Expand Up @@ -349,9 +349,9 @@ Bloom filter将集合中的元素映射到位数组中,用k(k为哈希函数

关于倒排索引的应用,更多请参见:

* [第二十三章:杨氏矩阵查找](23.0.md)
* [第二十四章:倒排索引关键词Hash不重复编码实践](24.0.md)
* [第二十六章:基于给定的文档生成倒排索引的编码与实践](26.0.md)
* [第二十三章:杨氏矩阵查找](03.02.md)
* [第二十四章:倒排索引关键词Hash不重复编码实践](09.04.md)
* [第二十六章:基于给定的文档生成倒排索引的编码与实践](09.05.md)

#### 密匙五、外排序

Expand Down Expand Up @@ -386,7 +386,7 @@ MapReduce是一种计算模型,简单的说就是将大批量的工作(数

更多具体阐述请参见blog内:

* [从Hadhoop框架与MapReduce模式中谈海量数据处理](08.2.md)
* [从Hadhoop框架与MapReduce模式中谈海量数据处理](08.02.md)
*[MapReduce技术的初步了解与学习](http://blog.csdn.net/v_july_v/article/details/6637014)

**其它模式/方法论,结合操作系统知识**
Expand Down

0 comments on commit 370ad0c

Please sign in to comment.