Cuda編程簡介,介紹Cuda環(huán)境搭建,以及如何驗證環(huán)境搭建成功;
介紹Cpu編程與Gpu編程的區(qū)別和聯(lián)系,引入為什么現(xiàn)在需要做Cuda編程,以及Cuda編程與Cpu編程處理延時的區(qū)別;
講解C語言內(nèi)存申請與釋放的接口函數(shù);
Cuda編程基礎(chǔ)概念進行講解,為后續(xù)編程做好準備;
引入第一個Cuda程序,方便以后講解Cuda編程的并行計算;
引入程序蘋果方式方法,蘋果自己的程序是否足夠優(yōu)秀;
引入多線程的概念,加上程序的執(zhí)行效率;
講解內(nèi)存連續(xù)存儲機制,優(yōu)化讀寫內(nèi)存的效率;
引入線程塊的概念,加大線程數(shù)量,精細線程管理,提升程序效率;
引入共享內(nèi)存的概念,實現(xiàn)線程同步機制;
應(yīng)用樹狀求和算法,對循環(huán)數(shù)據(jù)做進一步的優(yōu)化。