第50回　並列プログラミングにおける抽象化と細かい制御のトレードオフ

2011.12.08

　Haskellは遅延評価を特徴としています。しかし，どのような機能にも弱点はあります。第9回や第47回では，遅延評価自体が持つ弱点や，その問題を解決しようとした際に生じる問題点について解説しました。

　同様に，並列Haskellやデータ並列Haskellといった，GHCで提供されている並列処理の機能にも弱点があります。また，その問題を避けるために開発されたライブラリにも，相応の弱点があります。

　並列Haskellが提供する並列処理機能の抽象化能力は極めて強力ですが，抽象化され過ぎていて並列処理の制御が難しいという問題があります。一方，より低レベルの並列処理機能は，並列処理を直接制御できるものの，並列処理の抽象化能力が乏しく，大規模なプログラムを並列化するのは困難です。

　このように，現在のHaskellの並列処理機能は，理想的とはいえません。高速な並列プログラムをなるべく短期間で作成するには，それぞれの並列処理機能が持つ弱点を把握し，状況によって使い分けることが重要になります。

par関数やpseq関数の問題点

　これまでの回では，Haskellでの並列プログラミングを説明する際に，並列Haskellを使う例を多く取り上げました。しかし，並列Haskellには大きな欠点があります。「並列Haskellの基本的な関数であるpar関数やpseq関数の使い方をプログラマが間違いやすい」という点です。こうした関数の使い方を誤ると，プログラムの挙動が期待とは異なるものになる可能性があります。

　例を見てみましょう。第48回で取り上げた並列処理版のクイックソート関数では，「x `par` y `pseq` f x y 」という形の式を使うことで，xとyを並列に計算し，xとyのそれぞれの結果を使って計算を行っていました。第48回では，最終的なクイックソート関数の定義は以下のようになりました。

qsortPar :: (Ord a, NFData a) => Int -> [a] -> [a]
qsortPar = qsortParWithPivot' selectMiddle 0

qsortParWithPivot' :: (Ord a, NFData a) => ([a] -> a) -> Int -> Int -> [a] -> [a]
qsortParWithPivot' _ _ _ []  = []
qsortParWithPivot' _ _ _ [x] = [x]
qsortParWithPivot' f !currentDepth !limit xs
    | currentDepth >= limit = quickSortWithPivot f xs
    | otherwise             = losort ++ hisort `using` strategy
  where
      x      = f xs
      losort = qsortParWithPivot' f (currentDepth+1) limit [y | y <- xs, y < x]
      hisort = qsortParWithPivot' f (currentDepth+1) limit [y | y <- xs, y >= x]
      strategy result = rdeepseq losort `par`
                        rdeepseq hisort `pseq`
                        rdeepseq result

　ここで使われているstrategy関数の意味を復習しておきましょう。

　par関数を使った「x `par` y」という式は，「xを並列計算のタスクであるsparkに指定することで，xとyを並列に評価する」という意味です。pseq関数を使った「y `pseq` z」という式は，「yを評価した後にzを評価する」ことを意味します。par関数とpseq関数はそれぞれ右結合なので，「x `par` y `pseq` f x y」という式は，「x `par` (y `pseq` f x y)」と解釈され，「xとyを並列に評価し，その結果を使って『f x y』を計算する」という意味になります。

Prelude Control.Parallel> :i par
par :: a -> b -> b 	-- Defined in Control.Parallel
infixr 0 par
Prelude Control.Parallel> :i pseq
pseq :: a -> b -> b 	-- Defined in Control.Parallel
infixr 0 pseq

　同様に「x1 `par` x2 `par` ... `par` xn `pseq` f x1 x2 ... xn」という式は，「x1からxnまでを並列に計算し，それぞれの結果を利用して『f x1 x2 ... xn』を計算する」という定義になります。

　ただし，「x `par` y `pseq` f x y」という式では，xとyの中身はWHNFまでの評価しか保証されません。そこでstrategy関数では，第43回のコラムで説明したrdeepseq関数を利用することで，losortとhisortのリストの要素まで評価した後に「rdeepseq result」を評価しています。

　こう書くと簡単に見えますが，並列Haskellには罠があります。関数を間違って使ってしまっても，誤りに気づきにくいという問題です。

　評価を順番に行いたい場合，深く考えずにseq関数を使ってしまいがちです。しかし，第8回のコラムで説明したように，seq関数を使って「y `seq` z」と書いても，yの簡約がうながされるだけで「yを評価した後zを評価する」という意味にはなりません。一方，pseq関数を使って「y `pseq` z」と書けば，「yを評価した後にzを評価する」という意味になります。評価の順番を陽に指定したい場合には，seq関数ではなくpseq関数を使わなければなりません。

　しかし，seq関数とpseq関数の型や結合性は同じなので，pseq関数を使うべきところでseq関数を使ってしまった場合，誤りに気づきにくいという問題があります。唯一の解決方法はseq関数をインポートしないことですが，モジュール内の関数定義でseq関数が必要な場合には，この方法は利用できません。また，seq関数はPreludeモジュールで提供されている関数なので，hidingなどを使って陽にインポートの対象から取り除かない限り，必ずインポートされます（参考リンク）。

　また，par関数は「xとyを並列に評価する」という意味であることから，「xを並列計算のタスクであるsparkに指定する」という実装上での振舞いを意識せずに使ってしまうという問題もあります。par関数を単に「xとyを並列に評価する関数」だと誤解すると，pseq関数で良いところまでpar関数を使ってしまう可能性があります。pseq関数で済むところにpar関数を使ってしまうと，性能向上に寄与しないsparkが無駄に作られ，時間・空間的な効率を損なうという問題があります。par関数の型や結合性は，seq関数やpseq関数と同じなので，このような誤用があっても，seq関数とpseq関数の場合と同様に，誤りに気づくのは簡単ではありません。

Prelude> :i seq
seq :: a -> b -> b 	-- Defined in GHC.Prim
infixr 0 seq

　しかも，par関数やpseq関数を使った記述はプログラムの評価の流れに沿っていないため，並列Haskellではこうした関数の書き間違いが発生しやすくなっています。

par関数やpseq関数の問題点

あなたにお薦め

今日のピックアップ

NECが受注したe-Govのガバクラ移行が大幅遅延、構築手法の途中変更が影響か

生成AIを悪用して拡散するワームが登場する恐れ、セキュリティー研究者が警鐘

Javaはなぜかっこ悪いと思われているのか、ChatGPTと共に原因を探ってみた

PayPayと三井住友カードが取引履歴で資金繰り支援、加盟店取り込みへ高まる熱

有名人になりすまして投資広告を掲載、SNSで接触してみた結果

「四重苦」で伸び悩む日本市場、なぜ海外スマホメーカーが開拓に本腰を入れるのか

IIJ公式サイトのPVがある日突然13倍に、バズったわけでも炎上したわけでもない裏側

JavaScriptの文末のセミコロン、付けない場合はいったい何が起こるのか

ミッドレンジスマホのお薦めランキング、「値下げ」でコスパに変化

M3搭載「MacBook Air」とM2搭載モデルを比較、外付けディスプレー2台接続も試す

画面デザインが激変したAcrobat Reader、慣れるまでは旧UIとの併用も

縦長のWebページ全体を画像で保存、メニューから選べるEdgeがChromeより便利

注目記事

なぜ生成AI時代にAPI管理が重要か？ 分断されたデータを自動的にまとめて活用

世界の通信キャリアがクラウド活用を加速！通信業界の最新ユースケースは

ビジネスプロセスをつなぎ、データをつなぐ 変革を支えるSAP BTPの魅力

ID／パスワード入力はもう要らない！これからのSSOの「新しいカタチ」とは

AI環境を自前でつくる：ベンダー4社が解説するインフラ構築のポイントとは？

バックオフィス系クラウドサービス増加で生じた新たな課題への解決策とは

おすすめのセミナー

「仮説立案」実践講座

CIO養成講座 【第35期】

改革リーダーのコミュニケーション術

パワポ資料が見違える「ビジネス図解」4つのセオリー

間違いだらけの設計レビュー

オンライン版「なぜなぜ分析」演習付きセミナー実践編

問題解決のためのデータ分析活用入門

業務改革プロジェクトリーダー養成講座【第16期】

注目のイベント

日経クロステックNEXT 関西 2024

日経ビジネスCEOカウンシル

VUCA時代に勝ち残る戦略的サプライチェーン構築に向けて

人手不足を乗り越える 日本の産業界成長のシナリオ2024

キャリア・オーナーシップが社会を変える

DX Insight 2024 Summer

WOMAN EXPO 2024

デジタル立国ジャパン2024

DIGITAL Foresight 2024 Summer

成長戦略への次の一手、製品・サービス強化に効くDXの本質（仮）

おすすめの書籍

ソフトバンク もう一つの顔 成長をけん引する課題解決のプロ集団

対立・抵抗を解消し合意に導く 改革リーダーのコミュニケーション術

もっと絞れる AWSコスト超削減術

優秀な人材が求める３つのこと 退職を前提とした組織運営と人材マネジメント

Web3の未解決問題

ロボット未来予測2033

日経BOOKプラスの新着記事

「お前、もう帰れ！」東大卒の開発者が料亭で叱られた

はじめに：『金利 「時間の価格」の物語』

話題の本 書店別・週間ランキング（2024年4月第3週）

マッキンゼー調査で判明 日本企業のM＆Aに求められる戦略

新社会人が読んでおくべきおすすめのビジネス書 記事まとめ

『「キーエンス思考」×ChatGPT時代の付加価値仕事術』を著者田尻望が熱弁

はじめに：『図解 木造住宅トラブルワースト20＋3 「雨漏り事故」「構造事故」の事例から学ぶ原因と対策』

はじめに：『美術館に行く前3時間で学べる 一気読み西洋美術史』

はじめに：『ジオストラテジクス マンガで読む地政学 世界の紛争・対立・協調がわかる』

東京・吉祥寺 街々書林 旅心を刺激する魅惑の本屋さん

日経クロステック Special

What's New

経営

クラウド

アプリケーション／DB／ミドルウエア

運用管理

サーバー／ストレージ

クライアント／OA機器

ネットワーク／通信サービス

セキュリティ

この機能は会員登録（無料）で使えるようになります

フォロー連載・特集

設定

なぜ生成AI時代にAPI管理が重要か？分断されたデータを自動的にまとめて活用

ビジネスプロセスをつなぎ、データをつなぐ変革を支えるSAP BTPの魅力

CIO養成講座【第35期】

人手不足を乗り越える日本の産業界成長のシナリオ2024

ソフトバンクもう一つの顔　成長をけん引する課題解決のプロ集団

対立・抵抗を解消し合意に導く　改革リーダーのコミュニケーション術

もっと絞れる　AWSコスト超削減術

優秀な人材が求める３つのこと　退職を前提とした組織運営と人材マネジメント

はじめに：『金利　「時間の価格」の物語』

話題の本　書店別・週間ランキング（2024年4月第3週）

マッキンゼー調査で判明　日本企業のM＆Aに求められる戦略

新社会人が読んでおくべきおすすめのビジネス書　記事まとめ

はじめに：『図解木造住宅トラブルワースト20＋3　「雨漏り事故」「構造事故」の事例から学ぶ原因と対策』

はじめに：『美術館に行く前3時間で学べる　一気読み西洋美術史』

はじめに：『ジオストラテジクス　マンガで読む地政学　世界の紛争・対立・協調がわかる』

東京・吉祥寺　街々書林　旅心を刺激する魅惑の本屋さん