Merge pull request #179 from NickYadance/v2

V2
NickYadance · Mar 27, 2024 · c2fd637 · c2fd637
2 parents dbddf2b + 2609edb
commit c2fd637
Show file tree

Hide file tree

Showing 87 changed files with 802 additions and 227 deletions.
diff --git a/.gitignore b/.gitignore
@@ -28,3 +28,5 @@ yarn-error.log*
 .env.development.local
 .env.test.local
 .env.production.local
+
+.idea/
diff --git a/.idea/.gitignore b/.idea/.gitignore
diff --git a/.idea/codeStyles/codeStyleConfig.xml b/.idea/codeStyles/codeStyleConfig.xml
diff --git a/.idea/journal.iml b/.idea/journal.iml
diff --git a/.idea/jsLibraryMappings.xml b/.idea/jsLibraryMappings.xml
diff --git a/.idea/modules.xml b/.idea/modules.xml
diff --git a/.idea/vcs.xml b/.idea/vcs.xml
diff --git a/.idea/webResources.xml b/.idea/webResources.xml
diff --git a/lib/codes.js b/lib/codes.js
@@ -0,0 +1,29 @@
+import fs from 'fs';
+import path from 'path';
+import hljs from 'highlight.js/lib/core';
+
+hljs.registerLanguage('go', require('highlight.js/lib/languages/go'))
+
+const codesDirectory = path.join(process.cwd(), 'posts', 'codes');
+
+export function getAllCodeIds() {
+    const fileNames = fs.readdirSync(codesDirectory);
+    return fileNames.filter((filename) => filename.endsWith(".go"))
+        .map((fileName) => {
+            return {
+                params: {
+                    id: fileName.replace(/\.go$/, ''),
+                },
+            };
+        });
+}
+
+export async function getCodeData(id) {
+    const fullPath = path.join(codesDirectory, `${id}.go`);
+    const fileContent = fs.readFileSync(fullPath, 'utf8');
+
+    return {
+        id,
+        html: hljs.highlight(fileContent, {language: 'go'}).value
+    };
+}
diff --git a/lib/posts.js b/lib/posts.js
@@ -2,13 +2,14 @@ import fs from 'fs';
 import path from 'path';
 import matter from 'gray-matter';
 
-const md = require('markdown-it')({
+export const md = require('markdown-it')({
     html: true,
     linkify: true,
     typographer: true
 }).use(require('markdown-it-highlightjs'), {
     register: {
-        go: require('highlight.js/lib/languages/go')
+        go: require('highlight.js/lib/languages/go'),
+        nsql: require('highlight.js/lib/languages/sql')
     }
 }).use(require('markdown-it-katex'));
 

diff --git a/pages/codes/[id].js b/pages/codes/[id].js
@@ -0,0 +1,31 @@
+import {getAllCodeIds, getCodeData} from "../../lib/codes";
+import Layout from "../../components/layout";
+
+export default function Code({data}) {
+    return (
+        <Layout>
+            <pre>
+                <code className="hljs language-go">
+                    <div dangerouslySetInnerHTML={{__html: data.html}}/>
+                </code>
+            </pre>
+        </Layout>
+    );
+}
+
+export async function getStaticPaths() {
+    const paths = getAllCodeIds();
+    return {
+        paths,
+        fallback: false,
+    };
+}
+
+export async function getStaticProps({params}) {
+    const codeData = await getCodeData(params.id);
+    return {
+        props: {
+            data: codeData,
+        },
+    };
+}
diff --git a/pages/index.js b/pages/index.js
@@ -40,7 +40,6 @@ export default function Home({allPostsData}) {
                     ))}
                 </ul>
             </section>
-
         </Layout>
     );
 }

diff --git a/posts/binarysearch.md b/posts/binarysearch.md
@@ -1,32 +1,30 @@
 ---
-title: '彻底理解二分搜索的上下界问题'
+title: '理解二分搜索的上下界问题'
 date: '2023-11-10'
 description: '尽管二分查找的基本思想相对简单，但细节可以令人难以招架...'
 ---
-> 尽管二分查找的基本思想相对简单，但细节可以令人难以招架 ... — 高德纳
+> 尽管二分查找的基本思想相对简单，但细节可以令人难以招架 — 高德纳
 
 二分查找是一个迭代算法，基本思想是通过不断折半缩小查找范围，最终找到目标值。
 
-如果只对二分查找的代码实现死记硬背，在编码过程中非常容易对上下界和终结条件发晕，
-导致无法写出BugFree的代码。我们用数学的思想：**循环不变量**来描述整个迭代过程，避免发晕。循环不变量的原理类似多米诺骨牌，包括四个要素：
-1. $Variant$，定义
-2. $Start$，初始化
-3. $Loop$，保持
-4. $End$，终止
+如果只对二分查找的代码实现死记硬背，在编码过程中容易对上下界和终结条件发晕导致无法写出BugFree的代码。我们用数学的思想循环不变量来描述迭代过程，避免发晕。循环不变量的原理类似多米诺骨牌，包括四个要素
+1. $Variant$: 定义
+2. $Start$: 初始化
+3. $Loop$: 保持
+4. $End$: 终止
 
-首先我们定义二分查找的循环不变量为：对于一个有序数组 $a[l,r)$ 和目标值 $n$，在**左闭右开的数组区间$[l, r)$内，区间左边的元素都比$n$小(或者不存在)，区间右边的元素都比$n$大(或者不存在)。**
-$$ a[i]<n, i < l $$
-$$ a[i]>=n, i >= r $$
+首先我们定义二分查找的循环不变量为: 对于有序数组$a[l,r)$和目标值$n$，在**数组区间$[l, r)$内，区间左边的元素小于$n$，区间右边的元素大于等于$n$，即**
+$$ a[i]<n \ if \ i < l $$
+$$ a[i]>=n \ if \ i >= r $$
 算法开始时有$l=0,r=len(a)$，循环不变量成立。
 
-当我们不断缩小这个区间直到$l=r$，算法终止。此时$l$左边的元素都小于$n$，$l$ 右边的元素(包括自身)都大于等于$n$，我们得到一个有用的数学性质，即$a[l]$是目标值n在数组$a$中的**下界**。
-循环不变量定义的区间，实际上就是**目标值下界所在的区间**。
+不断缩小这个区间直到$l=r$，此时$l$左边的元素都小于$n$，$l$右边的元素(包括自身)都大于等于$n$，我们得到一个有用的数学性质，即$a[l]$是目标值n在数组$a$中的**下界**，循环不变量定义的区间就是**目标值下界所在的区间**。
 
 > 数组中N的下界是第一个大于或等于N的元素下标
 
-因此，保持过程就是要不断寻找下一个下界所在的子区间。
-1. 如果$a[mid]<n$，则n的下界在mid右边且不包括mid，区间$[mid + 1, r)$满足循环不变量
-2. 如果$a[mid]>=n$，则n的下界在mid左边且包括mid，区间$[l, mid)$满足循环不变量
+保持过程就是要寻找下一个下界所在的子区间。
+1. 如果$n > a[mid]$，n的下界在mid右边且不包括mid，区间$[mid + 1, r)$满足循环不变量
+2. 如果$n <= a[mid]$，n的下界在mid左边且包括mid，区间$[l, mid)$满足循环不变量
 
 对照四要素，就可以写出**寻找目标值下界**的二分搜索算法。
 ```go
@@ -35,7 +33,7 @@ func BinarySearchLowerBound(arr []int, n int) int {
 	high := len(arr)
 	for low < high {
 		mid := low + (high-low)>>1
-		if arr[mid] < n {
+		if n > arr[mid] {
 			low = mid + 1
 		} else {
 			high = mid
@@ -45,7 +43,7 @@ func BinarySearchLowerBound(arr []int, n int) int {
 }
 ```
 
-二分查找可以在二分搜索下界的基础上实现。
+二分查找可以在二分搜索下界的基础上实现，在迭代过程中提前判断$a[mid]=n$可以减少迭代次数，但丢失掉了下界算法的**稳定性**，因为下界只会有一个值。
 ```go
 func BinarySearch(arr []int, n int) int {
 	lowerBound := BinarySearchLowerBound(arr, n)
@@ -56,14 +54,49 @@ func BinarySearch(arr []int, n int) int {
 }
 ```
 
-也可以在迭代过程中提前对$a[mid]=n$做判断，减少迭代次数，但也丢失掉了算法的**稳定性**。
+与下界相对应的上界怎么求呢？数学定义里上下界对应的是一个数在排序数组的两端，例如下面例子里3的下界是a[2]，上界是a[4]。但是套用我们的下界算法并不能得到上界为4(你可以试试)，这时候可以做个处理，定义上界为**数学上界的右一位**，即例子里的a[5]。
+```
+a[i] 1 2 3(lower) 3 3(upper) 4(upper')
+i    0 1 2        3 4        5
+```
+
+这种处理方式参考的是c++ std里[upper_bound](https://en.cppreference.com/w/cpp/algorithm/upper_bound)&[lower_bound](https://en.cppreference.com/w/cpp/algorithm/lower_bound)的定义，上下界分别是在数组中**插入目标值并保持有序的第一个和最后一个位置**。
+- lower_bound: Searches for the first element in the partitioned range [first, last) which is **not ordered before** value.
+- upper_bound: Searches for the first element in the partitioned range [first, last) which is **ordered after** value.
+
+循环不变量只需要修改保持过程，将$n>a[mid]$修改为$n>=a[mid]$
+1. 如果$n >= a[mid]$，n的上界在mid右边且不包括mid，区间$[mid + 1, r)$满足循环不变量
+2. 如果$n < a[mid]$，n的上界在mid左边且包括mid，区间$[l, mid)$满足循环不变量
+
+```go
+func BinarySearchUpperBound(arr []int, n int) int {
+	low := 0
+	high := len(arr)
+	for low < high {
+		mid := low + (high-low)>>1
+		if n >= arr[mid] {
+			low = mid + 1
+		} else {
+			high = mid
+		}
+	}
+	return low
+}
+```
+
+另外在以上的定义下，N的上界与N+1的下界位置相同，可以直接用下界换算。
+```go
+func BinarySearchUpperBound(arr []int, n int) int {
+	return BinarySearchLowerBound(arr, n + 1)
+}
+```
 
-最后总结一下二分查找的循环不变量四要素。
-1. $Variant$， 目标值下界所在的区间
-2. $Start$， $l=0,r=len(a)$
-3. $Loop$， 如果$a[mid]<n$，则n的下界在mid右边且不包括mid，反之在左边
-4. $End$， $l=r$
+总结一下二分查找的循环不变量四要素，对有序数组$a[l,r)$
+- $Variant$: 目标值下界所在的区间
+- $Start$: $l=0,r=len(a)$
+- $Loop$: 如果$n>a[mid]$，则n的下界在mid右边且不包括mid，反之在左边
+- $End$: $l=r$
 
-> [二分查找有几种写法？它们的区别是什么？ - Jason Li的回答 - 知乎](https://www.zhihu.com/question/36132386/answer/530313852)
-> 
-> [算法导论](https://jingyuexing.github.io/Ebook/Algorithm/%E7%AE%97%E6%B3%95%E5%AF%BC%E8%AE%BA.pdf)
+## Reference
+- [二分查找有几种写法？它们的区别是什么？ - Jason Li的回答 - 知乎](https://www.zhihu.com/question/36132386/answer/530313852)
+- [算法导论](https://jingyuexing.github.io/Ebook/Algorithm/%E7%AE%97%E6%B3%95%E5%AF%BC%E8%AE%BA.pdf)
-Original file line number
+Diff line change
@@ Expand Up / @@ -40,7 +40,6 @@ export default function Home({allPostsData}) { @@
                         ))}
                     </ul>
                 </section>
             </Layout>
         );
     }
@@ Expand Down @@