その割り当て方をすると、一連のデータを別のGPUで持つ事態が発生するが、先の手法と同じで、各GPUで処理して残る上位k個のデータはそれほど多くないので、各GPUから上げられたデータをCPU側でアトミック処理をさせる。ここをGPUで処理させることも可能だが、全体の計算量に比べればわずかなので、CPU側で処理させても問題ないという判断である