CS285 Deep Reinforcement Learning 学习笔记
Abstract. CS285 Deep Reinforcement Learning 的学习笔记的索引。预计包含如下内容:
- 课程内容
- 如果有作业,理论分析可能会被和第一部分融合,如有代码和实验将包含代码和实验报告。
- 如果有意思的论文,可能包含该论文的阅读笔记。
Abstract. CS285 Deep Reinforcement Learning 的学习笔记的索引。预计包含如下内容:
Abstract. 本文是 https://doi.org/10.1007/s00224-023-10146-8 的阅读笔记。他们提出了求字符串最小字典序后缀的 $O(n^{3/4})$ 量子算法,但感觉非常套路。文章还证明了这个问题的平均复杂度下界 $\Omega(n^{1/2} / \log^{1/2} n)$ 和最坏复杂度下界 $\Omega(n^{1/2})$,但他自己并没有达到这个界。
Abstract. 本文是 2024 秋季学期音乐与数学大作业的笔记,研究题目是“管乐器的超吹”,尤其是为何开管乐器能够吹出偶数倍泛音,闭管乐器只能够吹出奇数倍泛音,而锥形管乐器看似和闭管相同,但实际上也能吹出偶数倍泛音。对管乐器的分类参见第 3,第 4 节。
警告: 本文可能包含如下要素:
如您无法接受这些操作,我们推荐您不要阅读此文。
Abstract. 解决了三个问题:最长公共子串、最小字典序循环移位、最长平方子串。暂时只看懂了最小字典序循环移位。
Abstract.
Abstract. 本文是 https://doi.org/10.1016/S1570-8667(03)00010-8 的阅读笔记。他们尝试把 https://doi.org/10.1137/0220002 的技术用在了量子计算机上,发现很有道理。很遗憾的是作者好像不是量子计算从业者,他们的很多 approach 都是有问题的,但也不是不能修复。因为他的思路非常 trivial,所以我们有精力帮他们重新算一遍。最后一节“处理周期性串”看起来比较对,但我们放弃仔细验证了。
Abstract. 本文是 https://doi.org/10.1137/0220002 的阅读笔记。文中提出了一种确定性的采样方法用于加速字符串匹配,由此得到了操作次数 $O(n)$ 时间 $O(\log^* n)$ 的并行算法。
文中用到了大量的分治、分块、复杂度平衡、递归的技巧,虽然这些无非是思考并行算法的时候的重点考虑方向,但第一次见的时候感觉还是比较奇妙,整个论文读完像做了一道超大的构造题。