こんにちは。この記事では、Scala の Stream プロセッシングライブラリである fs2 を使って、自作のBot フレームワークを作ってみたいと思います。

はじめに

Slack や Discord 等で使われるための Bot を作る、といった場合、どのようなプログラムを想定するでしょうか。多くの場合は使いたい言語の Slack のライブラリを利用したり、 hubot や ruboty といったフレームワークを利用することを考えるでしょう。IFTTT で済ませたりするかもしれません。今回の記事ではライブラリを利用して作る、ということではなく、利用するためのライブラリを作り、そのライブラリを使って Bot を作ることを考えてみましょう。

多くの場合、フレームワークやライブラリを選んで使うことはあっても、それを自分で作る経験というのは多くはないでしょう。今回は挑戦してみる手助けとして、Bot フレームワークを作ってみる過程を紹介していきたいと思います。

対象読者

この記事の読者に求める能力は次の通りです。

  • なんかしらのライブラリやフレームワークを使ってプログラミングをしたことがある
  • 書いたことのない言語をなんとなく読める
  • 英語のリファレンスをどうにかなめるぐらいはできる

実装に使ったライブラリや概念は、なるべく文章中で説明するつもりです。一部どうしても難しい概念があるので、書いてあるざっくりとした説明だけを読んで、詳細がわかる必要はありません。

Bot フレームワークを選んだ理由

Bot フレームワークを作ることを選んだのは、以下のような理由があります。

  • 比較的考えることが少ない
    • パフォーマンスはそこまで求められない
    • 保存しないと行けない状態は少ない
    • リトライ機構とかを作ると保存する状態が発生するけど、そうでもない限りはそこまでデータの保存に気を使わなくていいはず。
  • 実装にミスってもやり直しやすい
  • 真面目にやろうとすると考えることが多い

一言にまとめると、「馴染みやすくて奥深い」と言ったところでしょうか。知っているべきことが多くないほうがわかりやすいという理由もあります1

設計をする

早速コードを書くぞ、と言う前に、Bot フレームワークの設計を大まかに考えて行きましょう。コード上ですべてを 1 から考えるより、ある程度言葉で書き表すなどしてくほうが良いです。一般に言葉のほうが自由度が高いので。

Bot フレームワークを調べる

設計を考える前に必要なのは、既存実装の調査です。一切のオリジナルからライブラリを作ってうまくいくことはまあほとんどないでしょう。現在あるライブラリから、ヒントを得てみることが必要です。既存実装の問題点を解決したり、自分が使っているうちにほしいと思った機能を考えたり、そういった観点からライブラリを作っていくのは大いにやりやすいでしょう。

今回は実装として、以下の 2 つを参考にしました。各フレームワークの紹介は別の記事に任せます。

設計を考える

調査を終えたら、設計を考えてみましょう。実際には調査をしながら設計をしたり、設計をしたあとに調査をすることもあります2

前提条件

今回フレームワークを作成するとき、以下のような条件をもとに作成していきます。

  • パフォーマンスはそこまで重視しない
  • なるべく問題はコンパイル時にチェックしたい
  • 書きやすい

パフォーマンスを重視しないのは、そこまで求められることがないからという理由です。もちろん遅すぎる場合は問題になりますが、一般に使われるBotはそこまでの応答性を求められず、またたくさんのリクエストも処理する必要がないことがほとんどです。そのため、パフォーマンスと書きやすさ・使いやすさのトレードオフになる場合は後者を選択します。

なるべく問題をコンパイル時にチェックしたいというのは、まあ要するに型のことです。一般にBotはある情報からある情報への変換になるので、そのとき欠けている情報があるなどの理由で実行時エラーを起こしたくはないですよね。なので、なるべく書いた時点でチェックをしたいと思います。

もう一つ求めることとして、書きやすさがありますね。なるべく楽に書きたいという欲求はあるでしょう。一度作ったパーツを再利用しやすいといった特性があると嬉しそうですね。

入力・処理・出力

ところで、Bot を構成要素にわけるとどの様になるでしょうか。様々な分け方があると思いますが、私は入力・処理・出力の 3 つに分かれると考えました。

  • 入力 : チャット等で入ってくるメッセージを受け取る部分
  • 処理 : 入力を処理して出力に出す
  • 出力 : メッセージを出力する部分

例えば、標準入力から受け取った文字列の先頭に"Echo"という文字列をつけて返す Bot を考えてみましょう。この場合、

  • 入力 : 標準入力から文字列を受け取る
  • 処理 : 入力の文字列に "Echo" を先頭に足す
  • 出力 : 標準出力に出力

といった風に分けられると思います。この分け方は、それなりに自然に見えますね。見えるんです。

別の例を考えて見ましょう。5 秒ごとに Hello! と標準出力に表示する Bot を考えてみましょう。この場合、

  • 入力 : 5 秒に 1 回信号を出力するタイマー
  • 処理 : Hello!という文字列の作成
  • 出力 : 標準出力に出力

という風にわけることができますね。

入力・処理・出力に分けるメリット3

入力・処理・出力という構成要素に分けられると嬉しいことがいくつかあります。

一つの入力から複数の処理が分けて書ける

例えば、Slack でメッセージを受け取って、それがあるユーザーのときだけデータベースに書き込み、そうでない場合はオウム返しをする Bot を考えてみましょう。

もし入力・処理・出力をわけていない場合、以下のように分岐するコードを書く必要があるでしょう。

input.then(message => {
    if(isSpecialUser(message.user)){
        // write db
    } else {
        // echo bot
    }
})

こう見ると、データベースに書き込む作業とオウム返しをする作業は全然違うのに、それらのコードが近くにあってなんだか分かりづらいですね。これを 3 つわけて考えるとどのようになるでしょうか。

val input = ...
val bot1 = input.filter(message => isSpecialUser(message.user)).map(/* write db*/)
val bot2 = input.filter(message => !isSpecialUser(message.user)).map(/* echo bot */)

このように各 Bot ごとにわけて書くことがができます。Output も同様になるでしょう。Input が適切に部品としてわけられて4いれば、各処理をきれいに記述することができそうですね。

違う媒体の入力と出力を繋げやすい

例えば、Slack のメッセージの条件にあうものを Discord に流してみることを考えます5。この場合も、SlackとDiscordのInput Outputが適切に部品化されていれば、かんたんに記述することができますね。

val slackInput = ...
val discordOutput = ...
val bot = slackInput.filter(/* フィルター条件を書く*/).to(discordOutput)

Input as a Stream, Output as a Stream, Process as a Stream

入力・処理・出力にわけることにしたら、それぞれをどのように表すかを考えましょう。様々な方法があり、一般に多く使われるのはいわゆるイベント駆動6です。

今回もそのアプローチをとってもいいのですが、今回はStreamを使ってみましょう。上の例を見ると、InputもOutputも流れてくるデータを処理するものですね。そうなると Streamで処理をしようとするのはそこまで間違ったアプローチではなさそうです。

Streamといっても様々なライブラリがあるのでどれを選択するかは難しい問題ですが、今回はScalaのfs2を使いたいと思います。7

設計まとめ

  • 入力・処理・出力を分ける
  • (特に入力、出力に関して)再利用の可能な形にする
  • Streamを使った設計を行う

実装

それでは実装をしていきましょう。

fs2のコードを解説する余裕はないので公式ドキュメントを見てください。日本語だとこのあたりのQiitaの記事が非常にまとまっていて読みやすいです。

Coreの設計

出来上がったものがこちらになります。

package net.sh4869.bot

import cats.effect.Concurrent
import fs2.Pipe
import fs2.Stream

object Core {
  // T を流すStream
  type Input[F[_], T] = Stream[F, T]
  // Iの型のものを受け取ってOに変換する処理
  type Process[F[_], I, O] = Pipe[F, I, O]
  // Tを出力して何らの処理を行う。Outputは終点なのでUnit。
  type Output[F[_], T] = Pipe[F, T, Unit]
  // Bot。名前とInput、処理、Outputを受け取る。
  case class Bot[F[_] : Concurrent, I, O](name: String, input: Input[F, I], process: Process[F, I, O], output: Output[F, O]) {
    // Streamを作成する。inputからprocessを通りoutputに流す。
    def stream: Stream[F, Unit] = input.through(process).through(output)
  }
}

コアの設計はシンプルですね。Input -> Process -> Outputの順番でデータが加工されていくことを考えればいいでしょう。Fって何?と思う型がいると思いますが、これはエフェクトタイプです。わからない方は「は?」という感じだと思いますが、イメージとしてあるF[A]という型があったとき、Aを返す何らかの特徴を持つそれを包む型とでも思ってください。

概ねこのコードをベースに実装をしていくと良さそうです。この実装をもとに、いくつかBotを作ってみましょう。

package net.sh4869.bot

import cats.effect.ExitCode
import cats.effect.IO
import cats.effect.IOApp
import cats.syntax.functor._
import fs2.Pipe
import fs2.Stream
import net.sh4869.bot.Core._

object MainApp extends IOApp {
  override def run(args: List[String]): IO[ExitCode] = {
    val input: Input[IO, String] = Stream("one", "two", "three")
    val pipe: Process[IO, String, String] = _.map(v => s"count: ${v}")
    val output: Pipe[IO, String, Unit] = _.map(x => println(x))
    val bot = Bot("bot1", input, pipe, output)
    bot.stream.compile.drain.as(ExitCode.Success)
  }
}
$ sbt run
count: one
count: two
count: three

これは文字列one,two,threeを流して、それにそれぞれcount:というprefixを足し、それをプリントするものです。それぞれの処理が分離してかけていますね。もう一つ例を見てみましょう。

package net.sh4869.bot

import cats.effect.ExitCode
import cats.effect.IO
import cats.effect.IOApp
import cats.syntax.functor._
import fs2.Pipe
import fs2.Stream
import net.sh4869.bot.Core._
import scala.concurrent.duration._

object MainApp extends IOApp {
  override def run(args: List[String]): IO[ExitCode] = {
    val input: Input[IO, String] = Stream.awakeEvery[IO](5.seconds).map(_ => "5.seconds")
    val pipe: Process[IO, String, String] = _.map(v => s"count: ${v}")
    val output: Pipe[IO, String, Unit] = _.map(x => println(x))
    val bot = Bot("bot1", input, pipe, output)
    bot.stream.compile.drain.as(ExitCode.Success)
  }
}
$ sbt run
count: 5.second
count: 5.second
count: 5.second
count: 5.second
︙

標準入出力

さて、このままだと特に面白くはないので、標準入出力を例に考えてみましょう。

package net.sh4869.bot

import cats.effect.Blocker
import cats.effect.ConcurrentEffect
import cats.effect.ContextShift
import fs2.Stream
import fs2.concurrent.Queue
import fs2.concurrent.Topic
import fs2.io
import fs2.text
import net.sh4869.bot.Core._

class StdInOut[F[_] : ContextShift](blocker: Blocker)(implicit F: ConcurrentEffect[F]) {

  private val topic = F.toIO(Topic[F, String]("")).unsafeRunSync()

  private val queue = F.toIO(Queue.bounded[F, String](100)).unsafeRunSync()

  private val inputS = io.stdin[F](4096, blocker).through(text.utf8Decode).through(topic.publish)

  private val outputS = queue.dequeue.through(text.utf8Encode).through(io.stdout[F](blocker))

  def start: Stream[F, Unit] = Stream(inputS, outputS).parJoinUnbounded

  def stdin: Input[F, String] = topic.subscribe(100)

  def stdout: Output[F, String] = queue.enqueue
}

StdInOutというクラスを作りました。基本的にはstartstdinstdoutの型に注目してもらえればいいです。

package net.sh4869.bot

import cats.effect.Blocker
import cats.effect.ExitCode
import cats.effect.IO
import cats.effect.IOApp
import cats.syntax.functor._
import fs2.Pipe
import fs2.Stream
import net.sh4869.bot.Core._

object MainApp extends IOApp {
  override def run(args: List[String]): IO[ExitCode] = {
    Stream.resource(Blocker[IO]).flatMap(v => {
      val stdInOut = new StdInOut[IO](v)
      val input: Input[IO, String] = stdInOut.stdin
      val pipe: Process[IO, String, String] = _.filter(!_.isEmpty).map(v => s"input: ${v}")
      val output: Pipe[IO, String, Unit] = stdInOut.stdout
      val bot = Bot("bot1", input, pipe, output)
      bot.stream concurrently stdInOut.start
    }).compile.drain.as(ExitCode.Success)
  }
}

標準入力に来た文字列にinput:を追加し、標準出力に出力していくプログラムです。これも今までの例と同じようにinput, pipe, outputを分けることができています。

1
input: 1
2
input: 2
3
input: 3

共有可能であることを示すために、先程までのプログラムに加えて5秒ごとに標準出力に出力するプログラムも追加してみましょう。

package net.sh4869.bot

import cats.effect.Blocker
import cats.effect.ExitCode
import cats.effect.IO
import cats.effect.IOApp
import cats.syntax.functor._
import fs2.Pipe
import fs2.Stream
import net.sh4869.bot.Core._
import scala.concurrent.duration._

object MainApp extends IOApp {
  override def run(args: List[String]): IO[ExitCode] = {
    Stream.resource(Blocker[IO]).flatMap(v => {
      val stdInOut = new StdInOut[IO](v)
      val input: Input[IO, String] = stdInOut.stdin
      val pipe: Process[IO, String, String] = _.filter(!_.isEmpty).map(v => s"input: ${v}")
      val output: Pipe[IO, String, Unit] = stdInOut.stdout
      val bot = Bot("bot1", input, pipe, output)

      val input2: Input[IO, String] = Stream.awakeEvery[IO](5.seconds).map(_ => "5 seconds")
      val pipe2: Process[IO, String, String] = _.filter(!_.isEmpty).map(v => s"interrupt: ${v}")
      val output2: Pipe[IO, String, Unit] = stdInOut.stdout
      val bot2 = Bot("bot1", input2, pipe2, output2)
      Stream(bot.stream, bot2.stream, stdInOut.start).parJoinUnbounded
    }).compile.drain.as(ExitCode.Success)
  }
}
interrupt: 5 seconds
1
input: 1
interrupt: 5 seconds
22
input: 22
3
input: 3
interrupt: 5 seconds

エラー処理

ここでエラー処理に目を向けてみましょう。以下のように入力された数字をパースしてそれに1を足した数字を出力するBotを考えてみましょう。

package net.sh4869.bot

import cats.effect.Blocker
import cats.effect.ExitCode
import cats.effect.IO
import cats.effect.IOApp
import cats.syntax.functor._
import fs2.Pipe
import fs2.Stream
import net.sh4869.bot.Core._

object MainApp extends IOApp {
  override def run(args: List[String]): IO[ExitCode] = {
    Stream.resource(Blocker[IO]).flatMap(v => {
      val stdInOut = new StdInOut[IO](v)
      val input: Input[IO, String] = stdInOut.stdin
      val pipe: Process[IO, String, String] = _.filter(!_.isEmpty).map(v => s"> ${v.toDouble + 1}\n")
      val output: Pipe[IO, String, Unit] = stdInOut.stdout
      val bot = Bot("bot1", input, pipe, output)
      Stream(bot.stream, stdInOut.start).parJoinUnbounded
    }).compile.drain.as(ExitCode.Success)
  }
}

これを実行すると、当然数字以外の入力に対してエラーが発生します8

$ sbt run
(中略)
1
> 2.0
x
java.lang.NumberFormatException: For input string: "x"
        at sun.misc.FloatingDecimal.readJavaFormatString(Unknown Source)
        at sun.misc.FloatingDecimal.parseDouble(Unknown Source)
        at java.lang.Double.parseDouble(Unknown Source)
        at scala.collection.StringOps$.toDouble$extension(StringOps.scala:930)
        at net.sh4869.bot.MainApp$.$anonfun$run$4(Main.scala:23)
        at fs2.Chunk$Singleton.map(Chunk.scala:510)
        at fs2.internal.Algebra$Output.$anonfun$mapOutput$1(Algebra.scala:22)
        at fs2.internal.FreeC$$anon$7.cont(FreeC.scala:168)
        at fs2.internal.FreeC$ViewL$$anon$9$$anon$10.<init>(FreeC.scala:204)

困りましたね。エラーを処理してほしい。そこで、Coreの部分にちょっと手を加えます。

package net.sh4869.bot

import fs2.Pipe
import fs2.Stream


object Core {
  type Input[F[_], T] = Stream[F, T]
  type Process[F[_], I, O] = Pipe[F, I, O]
  type Output[F[_], T] = Pipe[F, T, Unit]

  case class Bot[F[_], I, O](name: String, input: Input[F, I], process: Process[F, I, O], output: Output[F, O]) {
    def stream: Pipe[F, String, Unit] => Stream[F, Unit] = onError =>
      input.through(process).through(output).handleErrorWith { e => Stream(s"bot $name error: ${e.toString}\n").through(onError) }
  }

}

streamの引数にPipe[F, String, Unit]を追加しました。これでエラーが発生したときにそのエラーメッセージをonErrorに流すことが可能です。今回はそのままエラーも標準出力に出力するパターンを考えてみましょう。

override def run(args: List[String]): IO[ExitCode] = {
    Stream.resource(Blocker[IO]).flatMap(v => {
        val stdInOut = new StdInOut[IO](v)
        val input: Input[IO, String] = stdInOut.stdin
        val pipe: Process[IO, String, String] = _.filter(!_.isEmpty).map(v => s"> ${v.toDouble + 1}\n")
        val output: Pipe[IO, String, Unit] = stdInOut.stdout
        val bot = Bot("bot1", input, pipe, output)
        Stream(bot.stream(stdInOut.stdout), stdInOut.start).parJoinUnbounded
    }).compile.drain.as(ExitCode.Success)
}
$sbt run
1
> 2.0
2
> 3.0
x
bot bot1 error: java.lang.NumberFormatException: For input string: "x"

Slackのクライアントを作る

ホントはここからが一番おもしろいんですが体力が切れたのでここまでにします……。次また記事を書きます。

次回予告

  • BotResourceの管理をする
  • Slackのクライアントを作る

今回作ったコードはGitHubに公開してあります。

おわりに

いかにも初心者向けみたいな文体で初めておいてなんですが、fs2を使ってる時点である程度難しくなるのは自明でしたね。すいません……。

みなさんが自分で設計するということにチャレンジしてみたり、fs2やストリームプログラミングに興味を持ってもらえたら幸いです。


  1. 現代の Web アプリケーションは正直複雑過ぎてある程度実用性を求めると作るのが大変になるので…… [return]
  2. これを研究でやると多くの場合絶望することになります [return]
  3. この下のコードはすべて擬似コードです [return]
  4. かつその部品が共有可能に実装されている必要がありますが [return]
  5. 規約とかは自分で確認してください。すべての発言を垂れ流すやつは多分規約違反になる気がする [return]
  6. Node.jsのイベントループを理解する | POSTD [return]
  7. 筆者がなれているので [return]
  8. 本来ならtoDoubleのところで例外処理をすべきというツッコミは一旦置いておいてください [return]