default search action

combined dblp search
author search
venue search
publication search

ask others

Andros Tjandra

> Home > Persons

Person information

Refine list

refinements active!

zoomed in on ?? of ?? records

view refined list in

export refined list as

showing all ?? records

2020 – today

see FAQ

What is the meaning of the colors in the publication lists?

2024
[j7]
- view
  - electronic edition @ jmlr.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/jmlr/PratapTSTBKENVF24
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/jmlr/PratapTSTBKENVF24
Vineel Pratap, Andros Tjandra, Bowen Shi, Paden Tomasello, Arun Babu, Sayani Kundu, Ali Elkahky, Zhaoheng Ni, Apoorv Vyas, Maryam Fazel-Zarandi, Alexei Baevski, Yossi Adi, Xiaohui Zhang, Wei-Ning Hsu, Alexis Conneau, Michael Auli:
Scaling Speech Technology to 1, 000+ Languages. J. Mach. Learn. Res. 25: 97:1-97:52 (2024)
[c38]
- view
  authority control:
- export record
  dblp key:
  - conf/icassp/XieLGTSSWJMK24
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/icassp/XieLGTSSWJMK24
Jiamin Xie, Ke Li, Jinxi Guo, Andros Tjandra, Yuan Shangguan, Leda Sari, Chunyang Wu, Junteng Jia, Jay Mahadeokar, Ozlem Kalinli:
Dynamic ASR Pathways: An Adaptive Masking Approach Towards Efficient Pruning of a Multilingual ASR Model. ICASSP 2024: 12201-12205
[c37]
- view
  - electronic edition @ openreview.net (open access)
  - details & citations
- export record
  dblp key:
  - conf/iclr/Liu0VSTH24
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/iclr/Liu0VSTH24
Alexander H. Liu, Matthew Le, Apoorv Vyas, Bowen Shi, Andros Tjandra, Wei-Ning Hsu:
Generative Pre-training for Speech with Flow Matching. ICLR 2024
[c36]
- view
  - electronic edition @ openreview.net (open access)
  - details & citations
- export record
  dblp key:
  - conf/icml/PrajwalS0VTLGWA24
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/icml/PrajwalS0VTLGWA24
K. R. Prajwal, Bowen Shi, Matthew Le, Apoorv Vyas, Andros Tjandra, Mahi Luthra, Baishan Guo, Huiyu Wang, Triantafyllos Afouras, David Kant, Wei-Ning Hsu:
MusicFlow: Cascaded Flow Matching for Text Guided Music Generation. ICML 2024
[i33]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - journals/corr/abs-2406-06251
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2406-06251
Chung-Ming Chien, Andros Tjandra, Apoorv Vyas, Matt Le, Bowen Shi, Wei-Ning Hsu:
Learning Fine-Grained Controllability on Speech Generation via Efficient Fine-Tuning. CoRR abs/2406.06251 (2024)
2023
[c35]
- view
  authority control:
- export record
  dblp key:
  - conf/icassp/JinSWTMH23
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/icassp/JinSWTMH23
Mumin Jin, Prashant Serai, Jilong Wu, Andros Tjandra, Vimal Manohar, Qing He:
Voice-Preserving Zero-Shot Multiple Accent Conversion. ICASSP 2023: 1-5
[c34]
- view
  authority control:
- export record
  dblp key:
  - conf/icassp/TjandraSZKMLS23
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/icassp/TjandraSZKMLS23
Andros Tjandra, Nayan Singhal, David Zhang, Ozlem Kalinli, Abdelrahman Mohamed, Duc Le, Michael L. Seltzer:
Massively Multilingual ASR on 70 Languages: Tokenization, Architecture, and Generalization Capabilities. ICASSP 2023: 1-5
[c33]
- view
  authority control:
- export record
  dblp key:
  - conf/icassp/YangTLZLK23
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/icassp/YangTLZLK23
Mu Yang, Andros Tjandra, Chunxi Liu, David Zhang, Duc Le, Ozlem Kalinli:
Learning ASR Pathways: A Sparse Multilingual ASR Model. ICASSP 2023: 1-5
[i32]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - journals/corr/abs-2301-02966
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2301-02966
Heli Qi, Sashi Novitasari, Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
SpeeChain: A Speech Toolkit for Large-Scale Machine Speech Chain. CoRR abs/2301.02966 (2023)
[i31]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - journals/corr/abs-2305-13516
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2305-13516
Vineel Pratap, Andros Tjandra, Bowen Shi, Paden Tomasello, Arun Babu, Sayani Kundu, Ali Elkahky, Zhaoheng Ni, Apoorv Vyas, Maryam Fazel-Zarandi, Alexei Baevski, Yossi Adi, Xiaohui Zhang, Wei-Ning Hsu, Alexis Conneau, Michael Auli:
Scaling Speech Technology to 1, 000+ Languages. CoRR abs/2305.13516 (2023)
[i30]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - journals/corr/abs-2309-13018
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2309-13018
Jiamin Xie, Ke Li, Jinxi Guo, Andros Tjandra, Yuan Shangguan, Leda Sari, Chunyang Wu, Junteng Jia, Jay Mahadeokar, Ozlem Kalinli:
Dynamic ASR Pathways: An Adaptive Masking Approach Towards Efficient Pruning of A Multilingual ASR Model. CoRR abs/2309.13018 (2023)
[i29]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - journals/corr/abs-2310-16338
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2310-16338
Alexander H. Liu, Matt Le, Apoorv Vyas, Bowen Shi, Andros Tjandra, Wei-Ning Hsu:
Generative Pre-training for Speech with Flow Matching. CoRR abs/2310.16338 (2023)
[i28]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - journals/corr/abs-2312-15821
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2312-15821
Apoorv Vyas, Bowen Shi, Matthew Le, Andros Tjandra, Yi-Chiao Wu, Baishan Guo, Jiemin Zhang, Xinyue Zhang, Robert Adkins, William Ngan, Jeff Wang, Ivan Cruz, Bapi Akula, Akinniyi Akinyemi, Brian Ellis, Rashel Moritz, Yael Yungster, Alice Rakotoarison, Liang Tan, Chris Summers, Carleigh Wood, Joshua Lane, Mary Williamson, Wei-Ning Hsu:
Audiobox: Unified Audio Generation with Natural Language Prompts. CoRR abs/2312.15821 (2023)
2022
[c32]
- view
  authority control:
- export record
  dblp key:
  - conf/icassp/TjandraCZSCBSSA22
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/icassp/TjandraCZSCBSSA22
Andros Tjandra, Diptanu Gon Choudhury, Frank Zhang, Kritika Singh, Alexis Conneau, Alexei Baevski, Assaf Sela, Yatharth Saraf, Michael Auli:
Improved Language Identification Through Cross-Lingual Self-Supervised Learning. ICASSP 2022: 6877-6881
[c31]
- view
  authority control:
- export record
  dblp key:
  - conf/icassp/SrivastavaWTKLS22
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/icassp/SrivastavaWTKLS22
Sangeeta Srivastava, Yun Wang, Andros Tjandra, Anurag Kumar, Chunxi Liu, Kritika Singh, Yatharth Saraf:
Conformer-Based Self-Supervised Learning For Non-Speech Audio Tasks. ICASSP 2022: 8862-8866
[c30]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - conf/interspeech/BabuWTLXGSPSPBC22
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/interspeech/BabuWTLXGSPSPBC22
Arun Babu, Changhan Wang, Andros Tjandra, Kushal Lakhotia, Qiantong Xu, Naman Goyal, Kritika Singh, Patrick von Platen, Yatharth Saraf, Juan Pino, Alexei Baevski, Alexis Conneau, Michael Auli:
XLS-R: Self-supervised Cross-lingual Speech Representation Learning at Scale. INTERSPEECH 2022: 2278-2282
[c29]
- view
  authority control:
- export record
  dblp key:
  - conf/slt/CheviPATS22
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/CheviPATS22
Rendi Chevi, Radityo Eko Prasojo, Alham Fikri Aji, Andros Tjandra, Sakriani Sakti:
NIX-TTS: Lightweight and End-to-End Text-to-Speech Via Module-Wise Distillation. SLT 2022: 970-976
[i27]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - journals/corr/abs-2209-05735
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2209-05735
Mu Yang, Andros Tjandra, Chunxi Liu, David Zhang, Duc Le, John H. L. Hansen, Ozlem Kalinli:
Learning ASR pathways: A sparse multilingual ASR model. CoRR abs/2209.05735 (2022)
[i26]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - journals/corr/abs-2211-05756
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2211-05756
Andros Tjandra, Nayan Singhal, David Zhang, Ozlem Kalinli, Abdelrahman Mohamed, Duc Le, Michael L. Seltzer:
Massively Multilingual ASR on 70 Languages: Tokenization, Architecture, and Generalization Capabilities. CoRR abs/2211.05756 (2022)
[i25]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - journals/corr/abs-2211-13282
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2211-13282
Mumin Jin, Prashant Serai, Jilong Wu, Andros Tjandra, Vimal Manohar, Qing He:
Voice-preserving Zero-shot Multiple Accent Conversion. CoRR abs/2211.13282 (2022)
2021
[j6]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - journals/access/EffendiTSN21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/access/EffendiTSN21
Johanes Effendi, Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Multimodal Chain: Cross-Modal Collaboration Through Listening, Speaking, and Visualizing. IEEE Access 9: 70286-70299 (2021)
[j5]
- view
  authority control:
- export record
  dblp key:
  - journals/ieicetd/NakayamaTSN21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/ieicetd/NakayamaTSN21
Sahoko Nakayama, Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Code-Switching ASR and TTS Using Semisupervised Learning with Machine Speech Chain. IEICE Trans. Inf. Syst. 104-D(10): 1661-1677 (2021)
[c28]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - conf/interspeech/TjandraPZK21
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/interspeech/TjandraPZK21
Andros Tjandra, Ruoming Pang, Yu Zhang, Shigeki Karita:
Unsupervised Learning of Disentangled Speech Content and Style Representation. Interspeech 2021: 4089-4093
[i24]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-2107-04082
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2107-04082
Andros Tjandra, Diptanu Gon Choudhury, Frank Zhang, Kritika Singh, Alexei Baevski, Assaf Sela, Yatharth Saraf, Michael Auli:
Improved Language Identification Through Cross-Lingual Self-Supervised Learning. CoRR abs/2107.04082 (2021)
[i23]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-2110-07313
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2110-07313
Sangeeta Srivastava, Yun Wang, Andros Tjandra, Anurag Kumar, Chunxi Liu, Kritika Singh, Yatharth Saraf:
Conformer-Based Self-Supervised Learning for Non-Speech Audio Tasks. CoRR abs/2110.07313 (2021)
[i22]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-2111-09296
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2111-09296
Arun Babu, Changhan Wang, Andros Tjandra, Kushal Lakhotia, Qiantong Xu, Naman Goyal, Kritika Singh, Patrick von Platen, Yatharth Saraf, Juan Pino, Alexei Baevski, Alexis Conneau, Michael Auli:
XLS-R: Self-supervised Cross-lingual Speech Representation Learning at Scale. CoRR abs/2111.09296 (2021)
2020
[j4]
- view
  authority control:
- export record
  dblp key:
  - journals/ieicet/TjandraSN20
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/ieicet/TjandraSN20
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Recurrent Neural Network Compression Based on Low-Rank Tensor Representation. IEICE Trans. Inf. Syst. 103-D(2): 435-449 (2020)
[j3]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - journals/taslp/TjandraSN20
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/taslp/TjandraSN20
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Machine Speech Chain. IEEE ACM Trans. Audio Speech Lang. Process. 28: 976-989 (2020)
[j2]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - journals/taslp/TjandraSN20a
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/taslp/TjandraSN20a
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Corrections to "Machine Speech Chain". IEEE ACM Trans. Audio Speech Lang. Process. 28: 1706 (2020)
[c27]
- view
  authority control:
- export record
  dblp key:
  - conf/icassp/WangMLLXMHTZZFZ20
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/icassp/WangMLLXMHTZZFZ20
Yongqiang Wang, Abdelrahman Mohamed, Duc Le, Chunxi Liu, Alex Xiao, Jay Mahadeokar, Hongzhao Huang, Andros Tjandra, Xiaohui Zhang, Frank Zhang, Christian Fuegen, Geoffrey Zweig, Michael L. Seltzer:
Transformer-Based Acoustic Modeling for Hybrid Speech Recognition. ICASSP 2020: 6874-6878
[c26]
- view
  authority control:
- export record
  dblp key:
  - conf/icassp/TjandraLZZWS0Z20
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/icassp/TjandraLZZWS0Z20
Andros Tjandra, Chunxi Liu, Frank Zhang, Xiaohui Zhang, Yongqiang Wang, Gabriel Synnaeve, Satoshi Nakamura, Geoffrey Zweig:
DEJA-VU: Double Feature Presentation and Iterated Loss in Deep Transformer Networks. ICASSP 2020: 6899-6903
[c25]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - conf/interspeech/NovitasariTYS020
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/interspeech/NovitasariTYS020
Sashi Novitasari, Andros Tjandra, Tomoya Yanagita, Sakriani Sakti, Satoshi Nakamura:
Incremental Machine Speech Chain Towards Enabling Listening While Speaking in Real-Time. INTERSPEECH 2020: 4372-4376
[c24]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - conf/interspeech/TjandraS020
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/interspeech/TjandraS020
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Transformer VQ-VAE for Unsupervised Unit Discovery and Speech Synthesis: ZeroSpeech 2020 Challenge. INTERSPEECH 2020: 4851-4855
[c23]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - conf/interspeech/EffendiTS020
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/interspeech/EffendiTS020
Johanes Effendi, Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Augmenting Images for ASR and TTS Through Single-Loop and Dual-Loop Multimodal Chain Framework. INTERSPEECH 2020: 4901-4905
[c22]
- view
  - electronic edition @ aclanthology.org (open access)
  - details & citations
- export record
  dblp key:
  - conf/sltu/NovitasariTSN20
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/sltu/NovitasariTSN20
Sashi Novitasari, Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Cross-Lingual Machine Speech Chain for Javanese, Sundanese, Balinese, and Bataks Speech Recognition and Synthesis. SLTU-CCURL@LREC 2020: 131-138
[i21]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-2005-11676
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2005-11676
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Transformer VQ-VAE for Unsupervised Unit Discovery and Speech Synthesis: ZeroSpeech 2020 Challenge. CoRR abs/2005.11676 (2020)
[i20]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-2010-12973
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2010-12973
Andros Tjandra, Ruoming Pang, Yu Zhang, Shigeki Karita:
Unsupervised Learning of Disentangled Speech Content and Style Representation. CoRR abs/2010.12973 (2020)
[i19]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-2011-02099
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2011-02099
Johanes Effendi, Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Augmenting Images for ASR and TTS through Single-loop and Dual-loop Multimodal Chain Framework. CoRR abs/2011.02099 (2020)
[i18]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-2011-02126
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2011-02126
Sashi Novitasari, Andros Tjandra, Tomoya Yanagita, Sakriani Sakti, Satoshi Nakamura:
Incremental Machine Speech Chain Towards Enabling Listening while Speaking in Real-time. CoRR abs/2011.02126 (2020)
[i17]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-2011-02127
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2011-02127
Sashi Novitasari, Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Sequence-to-Sequence Learning via Attention Transfer for Incremental Speech Recognition. CoRR abs/2011.02127 (2020)
[i16]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-2011-02128
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-2011-02128
Sashi Novitasari, Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Cross-Lingual Machine Speech Chain for Javanese, Sundanese, Balinese, and Bataks Speech Recognition and Synthesis. CoRR abs/2011.02128 (2020)

2010 – 2019

see FAQ

What is the meaning of the colors in the publication lists?

2019
[j1]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - journals/access/TjandraSN19
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/access/TjandraSN19
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
End-to-End Speech Recognition Sequence Training With Reinforcement Learning. IEEE Access 7: 79758-79769 (2019)
[c21]
- view
  authority control:
- export record
  dblp key:
  - conf/asru/EffendiTSN19
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/asru/EffendiTSN19
Johanes Effendi, Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Listening While Speaking and Visualizing: Improving ASR Through Multimodal Chain. ASRU 2019: 471-478
[c20]
- view
  authority control:
- export record
  dblp key:
  - conf/asru/TjandraSN19
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/asru/TjandraSN19
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Speech-to-Speech Translation Between Untranscribed Unknown Languages. ASRU 2019: 593-600
[c19]
- view
  authority control:
- export record
  dblp key:
  - conf/asru/NakayamaTSN19
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/asru/NakayamaTSN19
Sahoko Nakayama, Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Zero-Shot Code-Switching ASR and TTS with Multilingual Machine Speech Chain. ASRU 2019: 964-971
[c18]
- view
  authority control:
- export record
  dblp key:
  - conf/icassp/TjandraS019
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/icassp/TjandraS019
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
End-to-end Feedback Loss in Speech Chain Framework via Straight-through Estimator. ICASSP 2019: 6281-6285
[c17]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - conf/interspeech/TjandraS0S0019
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/interspeech/TjandraS0S0019
Andros Tjandra, Berrak Sisman, Mingyang Zhang, Sakriani Sakti, Haizhou Li, Satoshi Nakamura:
VQVAE Unsupervised Unit Discovery and Multi-Scale Code2Spec Inverter for Zerospeech Challenge 2019. INTERSPEECH 2019: 1118-1122
[c16]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - conf/interspeech/NovitasariTS019
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/interspeech/NovitasariTS019
Sashi Novitasari, Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Sequence-to-Sequence Learning via Attention Transfer for Incremental Speech Recognition. INTERSPEECH 2019: 3835-3839
[c15]
- view
  authority control:
- export record
  dblp key:
  - conf/ococosda/NakayamaKTS019
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/ococosda/NakayamaKTS019
Sahoko Nakayama, Takatomo Kano, Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Recognition and translation of code-switching speech utterances. O-COCOSDA 2019: 1-6
[i15]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-1905-11449
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1905-11449
Andros Tjandra, Berrak Sisman, Mingyang Zhang, Sakriani Sakti, Haizhou Li, Satoshi Nakamura:
VQVAE Unsupervised Unit Discovery and Multi-scale Code2Spec Inverter for Zerospeech Challenge 2019. CoRR abs/1905.11449 (2019)
[i14]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-1906-00579
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1906-00579
Johanes Effendi, Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
From Speech Chain to Multimodal Chain: Leveraging Cross-modal Data Augmentation for Semi-supervised Learning. CoRR abs/1906.00579 (2019)
[i13]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-1910-00795
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1910-00795
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Speech-to-speech Translation between Untranscribed Unknown Languages. CoRR abs/1910.00795 (2019)
[i12]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-1910-09799
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1910-09799
Yongqiang Wang, Abdelrahman Mohamed, Duc Le, Chunxi Liu, Alex Xiao, Jay Mahadeokar, Hongzhao Huang, Andros Tjandra, Xiaohui Zhang, Frank Zhang, Christian Fuegen, Geoffrey Zweig, Michael L. Seltzer:
Transformer-based Acoustic Modeling for Hybrid Speech Recognition. CoRR abs/1910.09799 (2019)
[i11]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-1910-10324
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1910-10324
Andros Tjandra, Chunxi Liu, Frank Zhang, Xiaohui Zhang, Yongqiang Wang, Gabriel Synnaeve, Satoshi Nakamura, Geoffrey Zweig:
Deja-vu: Double Feature Presentation in Deep Transformer Networks. CoRR abs/1910.10324 (2019)
2018
[c14]
- view
  authority control:
- export record
  dblp key:
  - conf/icassp/TjandraS018
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/icassp/TjandraS018
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Sequence-to-Sequence Asr Optimization Via Reinforcement Learning. ICASSP 2018: 5829-5833
[c13]
- view
  authority control:
- export record
  dblp key:
  - conf/ijcnn/TjandraS018
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/ijcnn/TjandraS018
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Tensor Decomposition for Compressing Recurrent Neural Network. IJCNN 2018: 1-8
[c12]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - conf/interspeech/MoriTS018
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/interspeech/MoriTS018
Takuma Mori, Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Compressing End-to-end ASR Networks by Tensor-Train Decomposition. INTERSPEECH 2018: 806-810
[c11]
- view
  - electronic edition via DOI (open access)
  - details & citations
  authority control:
- export record
  dblp key:
  - conf/interspeech/TjandraS018
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/interspeech/TjandraS018
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Machine Speech Chain with One-shot Speaker Adaptation. INTERSPEECH 2018: 887-891
[c10]
- view
  authority control:
- export record
  dblp key:
  - conf/slt/NakayamaTS018
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/NakayamaTS018
Sahoko Nakayama, Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Speech Chain for Semi-Supervised Learning of Japanese-English Code-Switching ASR and TTS. SLT 2018: 182-189
[c9]
- view
  authority control:
- export record
  dblp key:
  - conf/slt/TjandraS018
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/slt/TjandraS018
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Multi-Scale Alignment and Contextual History for Attention Mechanism in Sequence-to-Sequence Model. SLT 2018: 648-655
[i10]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-1802-10410
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1802-10410
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Tensor Decomposition for Compressing Recurrent Neural Network. CoRR abs/1802.10410 (2018)
[i9]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-1803-10525
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1803-10525
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Machine Speech Chain with One-shot Speaker Adaptation. CoRR abs/1803.10525 (2018)
[i8]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-1807-08280
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1807-08280
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Multi-scale Alignment and Contextual History for Attention Mechanism in Sequence-to-sequence Model. CoRR abs/1807.08280 (2018)
[i7]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-1810-13107
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1810-13107
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
End-to-End Feedback Loss in Speech Chain Framework via Straight-Through Estimator. CoRR abs/1810.13107 (2018)
2017
[c8]
- view
  authority control:
- export record
  dblp key:
  - conf/asru/TjandraS017
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/asru/TjandraS017
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Listening while speaking: Speech chain by deep learning. ASRU 2017: 301-308
[c7]
- view
  authority control:
- export record
  dblp key:
  - conf/asru/TjandraS017a
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/asru/TjandraS017a
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Attention-based Wav2Text with feature transfer learning. ASRU 2017: 309-315
[c6]
- view
  - electronic edition @ aclanthology.org (open access)
  - details & citations
- export record
  dblp key:
  - conf/ijcnlp/TjandraSN17
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/ijcnlp/TjandraSN17
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Local Monotonic Attention Mechanism for End-to-End Speech And Language Processing. IJCNLP(1) 2017: 431-440
[c5]
- view
  authority control:
- export record
  dblp key:
  - conf/ijcnn/TjandraSN17
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/ijcnn/TjandraSN17
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Compressing recurrent neural network with tensor train. IJCNN 2017: 4451-4458
[c4]
- view
  authority control:
- export record
  dblp key:
  - conf/mlsp/TjandraS017
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/mlsp/TjandraS017
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Speech recognition features based on deep latent Gaussian models. MLSP 2017: 1-6
[i6]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/TjandraSN17
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/TjandraSN17
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Compressing Recurrent Neural Network with Tensor Train. CoRR abs/1705.08052 (2017)
[i5]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/TjandraSN17a
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/TjandraSN17a
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Local Monotonic Attention Mechanism for End-to-End Speech Recognition. CoRR abs/1705.08091 (2017)
[i4]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/TjandraSMAN17
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/TjandraSMAN17
Andros Tjandra, Sakriani Sakti, Ruli Manurung, Mirna Adriani, Satoshi Nakamura:
Gated Recurrent Neural Tensor Network. CoRR abs/1706.02222 (2017)
[i3]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/TjandraSN17aa
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/TjandraSN17aa
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Listening while Speaking: Speech Chain by Deep Learning. CoRR abs/1707.04879 (2017)
[i2]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-1709-07814
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1709-07814
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Attention-based Wav2Text with Feature Transfer Learning. CoRR abs/1709.07814 (2017)
[i1]
- view
  - electronic edition @ arxiv.org (open access)
  - details & citations
- export record
  dblp key:
  - journals/corr/abs-1710-10774
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/journals/corr/abs-1710-10774
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura:
Sequence-to-Sequence ASR Optimization via Reinforcement Learning. CoRR abs/1710.10774 (2017)
2016
[c3]
- view
  authority control:
- export record
  dblp key:
  - conf/ijcnn/TjandraSMAN16
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/ijcnn/TjandraSMAN16
Andros Tjandra, Sakriani Sakti, Ruli Manurung, Mirna Adriani, Satoshi Nakamura:
Gated Recurrent Neural Tensor Network. IJCNN 2016: 448-455
2015
[c2]
- view
  authority control:
- export record
  dblp key:
  - conf/asru/TjandraSNA15
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/asru/TjandraSNA15
Andros Tjandra, Sakriani Sakti, Satoshi Nakamura, Mirna Adriani:
Stochastic Gradient Variational Bayes for deep learning-based ASR. ASRU 2015: 175-180
[c1]
- view
  authority control:
- export record
  dblp key:
  - conf/icassp/TjandraSNTAN15
- ask others
- share record
  persistent URL:
  - https://dblp.org/rec/conf/icassp/TjandraSNTAN15
Andros Tjandra, Sakriani Sakti, Graham Neubig, Tomoki Toda, Mirna Adriani, Satoshi Nakamura:
Combination of two-dimensional cochleogram and spectrogram features for deep learning-based ASR. ICASSP 2015: 4525-4529

Coauthor Index

see FAQ

manage site settings

To protect your privacy, all features that rely on external API calls from your browser are turned off by default. You need to opt-in for them to become active. All settings here will be stored as cookies with your web browser. For more information see our F.A.Q.