《Programming Abstractions in C》学习第73天,p293-p302总结,总计10页。
一、技术总结
1.时间复杂度
(1)quadratic time(二次时间)
p293, Algorithms like selection sort that exhibit O(N^2) performance are said to run in quadratic time。
2…
这篇2月的新论文介绍了Post-Hoc Adaptive Tokenwise Gating Over an Ocean of Specialized Experts (PHATGOOSE),这是一种通过利用一组专门的PEFT模块(如LoRA)实现零样本泛化的新方法
这个方法冻结整个模型,包括PEFT模块,并为每个模块训练一…