Após a identificação das unidades de significado, o pesquisador deve verificar se todos os aspetos do conteúdo foram abordados em relação ao objetivo (Burnard, 1991). O texto original é relido juntamente com a lista final de unidades de significado. Os lápis de cor são úteis para distinguir cada unidade de significado na transcrição original. Após este processo ter sido realizado, algum texto não marcado quase sempre permanece. O pesquisador deve então considerar se o texto não marcado deve ou não ser incluído. Se o texto não marcado der alguma resposta à pergunta de pesquisa, deve ser incluído na análise (Burnard, 1995). Quando o pesquisador está profundamente envolvido com os dados, tudo parece ser importante. No entanto, o processo de distanciamento é necessário, e o pesquisador deve se permitir deixar de lado as informações sem importância que não correspondem ao objetivo do estudo.
Antes que o pesquisador possa começar a criar categorias, as unidades de significado estendidas devem ser condensadas, o que significa que o número de palavras é reduzido sem perder o conteúdo da unidade (Graneheim & Lundman, 2004). A profundidade das unidades de significado determina o nível em que a análise pode ser realizada. Este processo de condensação é muitas vezes necessário quando os dados são baseados em entrevistas e quando a análise de conteúdo latente deve ser realizada. Para extrair o sentido dos dados, o material codificado pode ser dividido em domínios – grupos amplos baseados em diferentes focos do estudo. Graneheim e Lundman (2004) preferem a área de conteúdo conceitual, uma vez que, em sua opinião, esta elucida uma área específica e explícita. Por exemplo, o material pode ser dividido com base nas questões utilizadas quando os dados foram coletados ou em pressupostos teóricos da literatura (Bengtsson, 2016, p. 12).
No processo de categorização, são identificados temas e categorias. No entanto, na literatura não há consenso sobre quais títulos ou conceitos devem ser usados na análise de conteúdo. As subcategorias, que Burnard (1991) designa por sub-rubricas, são as unidades mais pequenas baseadas em unidades de significado. Na análise do manifesto, às vezes estes são os mesmos que os códigos das unidades de significado. As subcategorias podem ser classificadas em categorias mais amplas. O subtema do conceito pode ser usado na análise latente em vez das categorias de conceito. Os temas e categorias identificados devem ser internamente homogêneos e externamente heterogêneos, o que significa que nenhum dado deve se enquadrar entre dois grupos nem se encaixar em mais de um grupo (Krippendorff, 2004). Um tema é um conceito geral do significado subjacente a um nível latente interpretativo, e responde à pergunta "Como?"
Todas as categorias devem estar enraizadas nos dados a partir dos quais surgem. Mover unidades de significado entre categorias garante o desenvolvimento progressivo do resultado da categoria. Inicialmente, várias categorias são frequentemente geradas, mas o número é posteriormente reduzido (Burnard, 1991). Como o pesquisador sabe quando a categorização é boa o suficiente depende do objetivo do estudo, e a categorização é concluída quando uma explicação razoável foi alcançada (Bengtsson, 2016, p. 12).