第23回単独研究会(SWoPP2017)

日本応用数理学会「行列・固有値問題の解法とその応用」研究部会 第23回研究会

 

日本応用数理学会「行列・固有値問題の解法とその応用」研究部会では,第23回研究会を開催致します.本研究会は「2017年並列/分散/協調処理に関する『秋田』サマー・ワークショップ(SWoPP2017)」において,電子情報通信学会,情報処理学会の6研究会との連携により開催されます.


プログラム

7月27日 (木) 会場:3F研修室A

 

オープニング:(13:25 – 13:30) 主査:相島 健助(東京大学)

セッション1:MEPA-1 行列計算(13:30 – 15:00) 座長:今倉 暁(筑波大学)

  • 講演1(13:30 – 14:00)
    クラスタ環境向けタイルTSQRの性能モデル
    ○鈴木 智博,高柳 雅俊(山梨大学)

    概要:縦長行列のQR分解に対して、並列リダクションにより縦方向の依存性を緩和したCAQRが提案されている。タイルCAQRについても縦長行列でよい性能を発揮するが、タイルアルゴリズムは細粒度タスクの非同期実行が行われるため性能予測のためのモデルの構築が困難である。今回は、通信とタスクがオーバーラップしない1タイル列のQR分解(タイルTSQR)について性能モデルを構築した。FX10上でのタイルTSQRの性能評価と性能モデルの有効性について報告する。
  • 講演2(14:00 – 14:30)
    ヘテロジニアスクラスタシステムにおけるタイルCAQRアルゴリズム実装
    ○高柳 雅俊,鈴木 智博(山梨大学)

    概要:近年、GPUを搭載したスーパーコンピュータが多数登場している。しかし、このようなヘテロジニアスクラスタ向けの行列計算用ライブラリは未だ存在しない。並列性が高いタイルアルゴリズムにより、通信削減型QR分解アルゴリズムCAQRを東京大学情報基盤センターが所有するReedbush-Hに実装した。発表では、実装方法や実験による性能評価について報告する。
  • 講演3(14:30 – 15:00)
    階層型行列法における行列分割法
    ○伊田 明弘,河合 直聡(東京大学)

    概要:階層型行列法は、積分方程式法に現れる密行列の近似計算手法の一種としてしられている。階層型行列で表現された行列に対しては、一般の行列演算が可能であり、上記の問題に止まらず、数値解析における密行列計算伴う多くの有用な演算を効率的に行う手法となり得る.しかし、複雑な行列分割構造を有するため、LU分解など高度な演算を並列計算機上で行うことは困難である。本講演では、HPCに向けた階層型行列法の行列分割法について論じる。

 

セッション2:MEPA-2 並列・分散計算(15:15 – 16:45) 座長:片桐 孝洋(名古屋大学)

  • 講演4(15:15 – 15:45)
    並列マルチグリッド前処理付き共役勾配法のメニィコアクラスタ向け最適化
    ○中島 研吾(東京大学)

    概要:三次元ポアソン方程式を並列マルチグリッド前処理付き共役勾配法によって解く有限体積法コードに対してメニィコアクラスタ向け最適化(CM-RCM法,SELL-C-Sigma)を実施し,Oakforest-PACSシステム上で特性を評価した。
  • 講演5(15:45 – 16:15)
    ブロック赤-黒順序付けされた摂動/緩和MILU(0)前処理法のGPUとマルチコアCPUにおける性能評価
    ○塩谷 明美,山本 有作(電気通信大学)

    概要:ブロック赤黒順序付けは高い並列性と少ない同期点を持つ順序付け手法である。ILU(0)分解の棄却要素を補償するMILU(0)法は高い収束加速効果を持つ前処理法であるが、順序付けと併用することでゼロピボットを生じる可能性がある。ブロック赤-黒順序付けされたMILU(0)法に摂動または緩和を導入することで、ゼロピボットの問題を回避しつつ高い並列性を得ることが出来る。本発表では、PIC法におけるポアソンソルバに適用されたこの前処理の性能をGPUとマルチコアCPUの両方で評価し、最適なパラメータの違いについて検討を行う。
  • 講演6(16:15 – 16:45)
    非負値行列因子分解のためのTall-Skinny型並列実装法
    ○今倉 暁,新井 亮祐,櫻井 鉄也(筑波大学)

    概要:本講演では,信号処理や画像認識等で用いられる非負値行列因子分解(NMF)の並列実装法を提案し,数値実験からその有効性を検証する.NMFは与えられた非負値行列を非負値行列の積として低ランク近似を行う行列分解であり,主に交互最適化を反復的に適用することで計算される.提案法は,Tall-Skinny型QR分解のアイディアに基づく並列化戦略をとることで,各反復で必要とされる通信の削減を狙う.

 

セッション3:MEPA-3 行列分解と計算精度(17:00 – 19:00) 座長:鈴木 智博(山梨大学)

  • 講演7(17:00 – 17:30)
    Performance Evaluation of Integration of Multiple Randomized Low-Rank Singular Value Decompositions
    ○Takahiro Katagiri (Nagoya University), Mu Yang, Weichung Wang (National Taiwan University, Taiwan), Akihiro Ida (The University of Tokyo)

    Abstract: Integrated Singular Value Decomposition (iSVD) is a randomized algorithm proposed by T.Chen et.al. iSVD is carefully designed to obtain high parallelism with respect to accuracy. In this presentation, we report result of performance evaluation for iSVD by using a supercomputer in Nagoya University. Accuracy of low rank approximation by iSVD to a problem from static electric field analysis is also presented.
  • 講演8(17:30 – 18:00)
    行列積に対する再現性のある計算法について
    ○尾崎 克久(芝浦工業大学),荻田 武史(東京女子大学)

    概要:CPUのコア数など,異なる計算機環境においても同一の数値計算結果を出力する再現性を持つアルゴリズムが研究されている.行列積に関して,エラーフリー変換を用いた再現性のある計算法を提案する.最も高速な方式は,近似計算とほぼ同等の計算コストで実行可能である.提案手法は,計算環境により内部の計算順が異なるgemmを用いても,同一の数値計算結果が得られる長所がある.また,精度保証理論から,数値計算として最良の結果を得る再現性ある計算方法を紹介する.
  • 講演9(18:00 – 18:30)
    Cholesky QR法を用いたブロック片側ヤコビ法の誤差解析
    ○工藤 周平,山本 有作(電気通信大学)

    概要:ブロック片側ヤコビ法(OSBJ)は特異値分解手法の1つであり、高い並列性と実行効率のため、近年注目されている。OSBJでは行列の列ブロックのペアをある順序で選び、右からある直交行列Vをかけることでペアの列直交化を行うが、有限精度計算では十分に直交化できず、収束が停滞する可能性がある。そこで我々はCholesky QR法を用いてVを計算するHariらのV2手法に対して誤差解析を行った。本発表ではこの結果と並列環境における実験結果を示す。
  • 講演10(18:30 – 19:00)
    密行列一般化シフト線形方程式向けKrylov部分空間反復法の分散並列実装と性能評価
    ○矢野 貴大,二村 保徳,櫻井 鉄也(筑波大学)

    概要:一般化固有値問題に対する周回積分型固有値解法において,複数の一般化シフト線形方程式の求解が計算時間の主要部となっている.近年,一般化シフト線形方程式向けKrylov部分空間反復法が提案されており,周回積分型固有値解法に適用することで計算時間の削減が期待される.本講演では,とくに大規模密行列を対象とした一般化シフト線形方程式向けKrylov部分空間反復法の分散並列実装手法を提案し,性能評価を行う.

 

クロージング:(19:00 – 19:05) 主査:相島 健助(東京大学)