• 総合窓口
  • 03-5730-6162

Raspberry PiとNode-REDで社内研修@2022-画像・音声
ケー・ティー・システムは製造業向けSIerとして、工場現場の効率化・コストダウンを推進します。

Raspberry PiとNode-REDで社内研修@2022-画像・音声

2022.07.01

2022年度の新入社員たち6人に社内研修について振り返ってもらいました。
本年度の研修課題も、Raspberry PiとNode-REDを使った「世の中に必要なもの」です。

研修テーマ

テーマは下記の3グループに分かれました。

本コラムでは、画像・音声認識関連の課題解決をテーマにした、6人の内2名の研修内容を紹介します。

ロボットと画像認識を組み合わせた警備システム ~N.K~

SunFounder社のPiCar-Xというスマートセンサー カーロボットを使った、
画像認識を使用した警備システムを考案しました。

開発概要

このシステムでは、画像認識により危険物を察知すると、カーロボットに命令を飛ばし、カーロボットが動きます。
そして、従業員に危険を知らせたり、防犯グッズを用意するシステムとなっています。

また、Slackと連携し、操作や通知を行う機能も作成しました。
特に何もない状況でも、Slackに特定の文章を送れば、その時の状況を見ることができます。
また、この警備システムが正常に動作しているか分かるよう、定刻になったらSlackに動作していることを通知するようにしました。

実際の実装では…

開発の際、様々な問題にぶつかりました。

最初に引っかかったのは、画像認識ツールです。
使う予定だった画像認識ソフトは、マニュアル通りにインストールしても何度か方法を変えて試しても動きませんでした。
そのため、当初の構想を変更し、Google社のTeachable Machineという画像認識サイトを使用しました。
この画像認識ツールを使用することにしたところ、とてもスムーズに実装することが出来ました。

次に引っかかったのは、ロボットの操作です。
サンプルプログラムは初めて触れるPythonで作られたもので、カーロボットが動かなかったり、エラーが発生したりと苦戦しました。
それでも、Google先生と何となくの感覚で修正したら動いてくれました。Pythonってすごい。
もちろん、謎のエラーに悩まされたり、 実装が少々無理やりだったり、先輩に助けを求めたりもしましたが、無事ロボットを動かすプログラムを書くことができました。

最後に引っかかったのは、Slackとの連携です。
ただ連携させて、文字列を返す程度ならすぐに出来ました。
しかし、Slackからの命令を受け取って、Pythonプログラムを起動したり、ファイルをSlackに送ったりするのが思ったよりも大変でした。
同じ内容のSlack通知が2回連続で送信されるという現象にも遭遇し、解決するのに苦慮しました。

課題
  • 後ろにセンサーが無いので、バックで元の位置に戻る時の精度が低い。

精度向上のためには後方用のセンサーも欲しいところです。

  • 電池はちゃんとチェックする。

カーロボットで使用する電池は一般的な乾電池だと思い込んでいたら、18650バッテリーという特殊な電池でした。

社内研修を終えて

初めて使用したPython言語でロボットを動かすことが出来るかどうか不安でしたが、しっかり動かすことが出来ました。
入社当初はプログラミングのプの字も分かりませんでしたが、社外研修と社内研修を終えて、ミの字くらいまでは分かった気がします。

簡単に音声で画像を文字起こし ~後藤~

​こんにちは。後藤と申します。
突然ですが、デジタル化という単語をご存じでしょうか?
端的に言えばアナログの作業をデジタルに置き換えるといったことです。
2022年現在デジタル化は様々なところで推進され、私自身その流れに対しポジティブな感情を抱いていましたので、常々自分でもやってみたいと思っていました。
そこで今回、私は簡単なデジタル化に挑戦してみようと思い、画像に含まれる文字や音声を文字に起こし、Slackに送信する機能を開発致しました。

提案・開発内容紹介

テーマ: 現実をデータとして扱えるようにする!

今回開発した内容は複数あります。

一つ目は、写真や音声をSlackに投稿することそれが自動的にテキスト化され、テキストファイルやGoogleスプレッドシートに保存する機能です。
そのテキストファイルの内容はSlackに送信されますので、すぐに確認できます。

二つ目はテキストを読み上げる機能です。
こちらはおまけのような機能ではありますが、Slackで命令することで機械音声でテキストファイルを読み上げることができます。

実際の動作オペレーションは以下の通りです。

共通作業

  1. Raspberry Pi起動
  2. Slack起動(iPhone側の方が望ましい)
  3. Slackの自由課題-後藤に移動する

画像の文字起こし

  1. メッセージ欄に画像と入力し画像を添付して送信
  2. しばらく待つ
  3. 結果が出るとgotobotからメッセージが届く

音声の文字起こし

  1. Slackで音声クリップを作成する
  2. メッセージ欄に音声と入力し、先ほど作成したクリップを添付して送信
  3. しばらく待つ
  4. 結果が出るとgotobotからメッセージ届く

音声の読み上げ

  1. スプレッドシートで読み上げしたいセルを確認する
  2. メッセージ欄に「読み上げ {画像or音声} {行番号}」といった風に入力する
  3. しばらく待つ
  4. 結果が出るとスピーカーから音声が出力される
振り返ってみて

全体的にスケジュール通り作業を進められませんでした。
出来上がったものの完成度は60%といった具合です。
まだまだ改善の余地がありますので少しばかり悔しい気持ちです。

原因としては人に頼ることが遅れた為だと思っています。
今後は作業に詰まった時など、もっと早く人に相談できるように精進してまいります。

コラム

ポリシー

  • ISMS