【記事】YouTube、動画に自動で字幕をつける機能を導入

IT Mediaの記事の紹介

YouTube、動画に自動で字幕をつける機能を導入 – ITmedia News
http://www.itmedia.co.jp/news/articles/0911/20/news063.html

マイクに向かってしゃべった声を音声認識機能で字幕にしてくれるというもの。なかなかやりますなぁ。

もちろん認識率は100%ではないだろうが、それも引き続き改善を続けていくそうだ。こ英語の認識率は高いが、漢字かな変換が必要な日本語では実用になるまでまだまだ時間がかかりそうである。

1つ提案だが、音声認識に使ったデータを、音声解説に使用できないだろうか? トラックをもう一つ増やせばすむこと。データが増えるが、ストレージの値段も下がり続けているので問題にならないだろう。

【記事】Dyslexiaの人に便利なIntel Reader

 インテルは11月10日に、OCRを内蔵したポータブルの音声読み上げ装置を発表した。4インチのモニターと5Mのカメラを搭載し、撮影した画像を文字認識して、その結果を読み上げるというもの。重さも500グラム弱で持ち運びが可能。

 発表記事では視覚障害者や難読症の人に便利だとあるが、全盲の人が使うときには、別売りのキャプチャーステーションも同時に購入すると便利かもしれない。弱視の人向けの機能としては文字拡大や色変換などに対応しているので、読み上げ機能が付いた電子ルーペとして利用できるだろう。

 難読症の人には特に便利かもしれないが、iPhoneで同じような機能が実現できるんじゃないかと思ってしまう…。

Products and Solutions for Healthcare
Products and Solutions for Healthcare

続きを読む →

【記事】あきちゃんの魔法のポケットプロジェクト

 東大の中邑先生が実施しているプロジェクト

 携帯電話を使って、発達障害などを抱える子供たちの日常生活をサポートしようというプロジェクトが始まっている。東京大学先端科学技術研究センターとソフトバンクモバイルが2009年6月に開始した「あきちゃんの魔法のポケットプロジェクト」である。子供たちに携帯電話を渡し、勉強やコミュニケーションといった場面での有効性を実証する。 携帯電話を使って、発達障害などを抱える子供たちの日常生活をサポートしようという「あきちゃんの魔法のポケットプロジェクト」

 ここで紹介されているアプリは、主にiPhone上で動作している。ぱっと見、携帯で動かす必要があるかどうか微妙なものが多い。これまではPDAで実現していたが、携帯電話の処理能力が向上したことや価格が下がってきたことなどが影響しているんだろう。日本はPDAも手に入れるのが難しくなってきたしね。

 日本製の携帯電話でも、iアプリで動くコミュニケーションエイドなどがあったけど、DoJaのバージョンがたくさんあって、個別の端末で動作テストが大変などの制約があったから勝手アプリが広がらなかったんだろうなぁ。

CBSドキュメント:Creating The Bionic Arm

 セグウェイの開発者のKamen氏が退役軍人省と開発した驚異的な義手の開発レポート。

 毎週録画して見ている「第2アサヒジャーナル」(これも工場が好きな人にはお勧め)の時間が押して、その後の番組のCBSドキュメントがたまたま録れていたので、見ることができたのだが、義手の開発ってここ数年で非常に進んでいるのですね。

 こうした手足を失う原因は、残念ながら今でも戦争や紛争などが原因なのです。義手の研究にこれだけお金が掛けられるのも軍が関与しているからなのだけど、この技術もいずれはロボット兵器に応用されていくのでしょうか?

 本家のCBSに動画が公開されていたのでリンクしておきます。


Watch CBS Videos Online

WCAG 2.0 Theme Song Web Content Accessibility Guidelines – Disability

 Webアクセシビリティの国際的なガイドラインが2008年12月11日、約10年ぶりに更新された。 この改訂は世界的にも大きな影響を与えるものと思われる。日本のJIS X8341-3も制定から4年を迎え、来年には改訂されることになっている。もちろん、ダブルスタンダードにならないようにWCAG2.0とも十分連携系が計られている。

Web Content Accessibility Guidelines (WCAG) 2.0

 下の動画はWCAGの有志のメンバーが作ったテーマソングだそうだ。日本でもJISの歌とか作ろうか(^^;