Review: An Assisted Photography Framework to Help Visually
Impaired User Properly Aim a Camera
MARYNEL VAZQUEZ and AARON STEINFELD , Carnegie Mellon University
MARYNEL VAZQUEZ and AARON STEINFELD , Carnegie Mellon University
http://dx.doi.org/10.1145/2651380
We
propose an assisted photography framework to help visually impaired users
properly aim a camera and evaluate our implementation in the context of
documenting public transportation accessibility. Our framework integrates user
interaction during the image capturing process to help users take better pictures
in real time. We use an image composition model to evaluate picture quality and
suggest providing audiovisual feedback to improve users’ aiming position. With
our particular framework implementation, blind participants were able to take
pictures of similar quality to those taken by low vision participants without
assistance. Likewise, our system helped low vision participants take pictures
as good as those taken by fully sighted users. Our results also show a positive
trend in favor of spoken directions to assist visually impaired users in
comparison to tone and silent feedback. Positive usefulness ratings provided by
full vision users further suggest that assisted photography has universal
appeal.
Additional
Key Words and Phrases: Photography, visually impaired, universal design,
accessibility, transit
Viewer
: Ardhi Ma’arik
Kajian artikel ilmiah
ini bertujuan untuk mengetahui konsep interaksi manusia-komputer di teknologi
modern sekarang ini untuk menyelesaikan permasalahan yang ada dengan bantuan
teknologi. Kajian ini membahas sebuah artikel ilmiah yang membahas interaksi
perancangan sebuah sistem untuk membantu pengguna yang memiliki kekurangan
pengelihatan, hingga pengguna tunanetra mengetahui lingkungan sekitar, serta
untuk mendokumentasikan hambatan ketersedian akses transportasi umum. Pada
artikel ini menggunakan sebuah teknologi pemprosesan pemotretan gambar secara real
time dan menghasilkan timbalbalik berbentuk audiovisual.
Tiga hal yang menjadi
fokus utama apa yang dilakukan penulis dalam artikel ilmiah tersebut yaitu: 1)
mengevaluasi kualitas dari susunan gambar yang diambil secara realtime
ketika gambar diambil; 2) mencoba mengarahkan pengguna berdasarkan objek dari
gambar yang didapatkan; 3) secara otomatis memilih gambar akhir dari susunan
gambar yang diambil pengguna. Tiga hal tersebut merupakan pengembangan dari apa
yang telah penulis lakukan sebelumnya [Vazquez dan
Steinfeld 2011a, 2011b,2012].
Penulis juga membahas
teknologi-teknologi sejenis yang sudah ada sebelumnya, mulai dari VizWiz,
HeadShot, EasySnap, PotretFramer, aplikasi pada iPhone (iOS5). Bebrapa aplikasi
tersebut, penulis mencoba membandingkann dengan apa yang penulis hasilkan
(aplikasi yang dihasilkan), dari sekitar sepuluh variable yang dibandingkan
hanya terdapat dua variable yang menjadi kekurangan fari aplikasi yang dibuat
penulis, yaitu variable memberitahukan pengguna ketika gambar akhir yang
dihasilkan memiliki kualitas yang rendah dan keberlajutan untuk
menginformasikan pengguna tentang lokasi dan ukuran dari target. Menurut
reviewer salah satu dari dua variabel yang mengalami kekurangan seharusnya
dapat ditingkatkan lagi dikemudian hari, pemberitahuan kepada pengguna ketika
gambar yang diambil memiliki hasil yang tidak bagus dapat menghasilkan
interpretasi yang salah yang nantinya akan membuat pengguna melakukan tindakan
yang salah karena kesalahan interpretasi dari sistem yang ada.
Untuk mengolah citra
yang didapatkan menggunakan kamera, penulis menggunakan sebuah algoritma untuk
mengevaluasi Region of Interest(ROI). Penjelasan lengkap tentang
algoritma yang digunakan penulis paparkan di tulisan sebelumnya Vazquez and
Steinfeld [2011a]. berikut merupakan ringkasan dari algoritmanya: 1) menghitung
pola yang menarik dari gambar yang mengkodekan conspicuity lokal. Itti and Koch [2001]; 2)
memilih kandidat daerah yang menarik; 3) pilih kandidat yang paling memiliki
arti.
Setelah mendapatkan objeknya sistem memberikan umpan balik kepada pengguna yang
dibagi menjadi tiga mode: 1) Speech: yang akan memberikan informasi
tentang orientasi- relatif terhadap pusat, serta sebagai jarak antara keduanya;
2) Tune: pitch nada yang berulang menunjukan jarak dari pusat yang di
sarankan; 3)Silent: sistem yang menangkap adegan terus menerus tanpa
memberikan bimbingan yang terdengar. Setiap melakukan operasi, sistem tersebut menggunakan semua
metode umpan balik kepada pengguna.
Secara umum penulis memaparkan tahap-tahapan untuk melakukan penelitian
secara lengkap dan terstruktur dan juga menjelaskan jurnal-jurnal yang berhubungan
dengan tulisannya ini. Sehingga pembaca dengan mudah mengerti apa yang sedang
dilakukan oleh penulis bagaimana caranya dan siapa aja yang mendukung
terlaksananya sistem yang penulis kembangkan.
No comments:
Post a Comment