基于数据分布特征的稀疏矩阵向量乘优化研究
Date:
本报告所汇报的内容主要覆盖课题组两个已经发表的工作和一个正在进行的工作。两个已发表的工作分别是:“TaiChi: A Hybrid Compression Format for Binary Sparse Matrix-Vector Multiplication on GPU”和“AMF-CSR: Adaptive Multi-Row Folding of CSR for SpMV on GPU”。第一个工作于2022年4月在国际高水平期刊TPDS上出版,第二个工作被国际高水平会议ICPADS2021收录。第三个工作“Revisiting Thread Configuration of SpMV Kernels on GPU: A Machine Learning Based Approach”是课题组目前正在进行的工作。本报告所汇报的内容致力于提升面向GPU的SpMV的计算效率,针对高数据传输开销、低缓存命中率和不均衡负载、单一线程配置方案的局限性这三个问题提出了相应的解决方案。