1.购买cell处理器ps3
安装操作系统,安装编程环境cellsdk
利用该编程环境编译mpi库,blas库,lapack,blacs,scalapck库
这些库放到intel上的异构编程环境下,编写并行程序,将生成的可执行程序放到ps3上,与intel上的运行
测试普遍的blas库和ibm提供的面向cell的blas库的效率差异
2.intel上的多机并行
安装远程控制软件,在centos上安装gcc等开发工具,安装mpi,ssh,进行mpi程序的并行运行
3.研究scalapck源程序
以一个最简单的程序开始,研究blacs如何初始化处理器网格,如何完成数据分布,了解其主要采用的块循环划分方法,及如何改进scalapck使其适应于异构环境下的特殊目的。
将根据dag及运行目标(完成时间,功耗)进行的数据分配算法整合进scalapack中,并修改块循环划分完成数据的分布和计算。