Question

0

221

Views

Cómo obtener el patrón de expresiones regulares más cercano basado en un índice de palabras JS

Esta es mi cadena:

 "1 00:01:46,356 --> 00:01:49,893 What is this? It's blue. 2 00:01:50,794 --> 00:01:54,998 We used a different chemical process, but it is every bit as pure. 3 00:01:55,199 --> 00:01:58,267 It may be blue, but it's the bomb."

Tengo la palabra índice "químico" que es: 107 Necesito el patrón de tiempo más cercano y usé expresiones regulares, aquí está mi código:

 const st = /above subtitle text var re = /[0-9][0-9]:[0-9][0-9]:[0-9][0-9],[0-9][0-9][0-9]/; const match = st.match(re);

¿Cómo puedo disminuir la cantidad de mi número de índice para alcanzar el patrón de tiempo más cercano a él? El valor devuelto aquí debería ser: 00:01:50,794 --> 00:01:54,998

almost 4 years ago · Juan Pablo Isaza

2 answers

Answer question

0

Simplemente puede usar una búsqueda anticipada positiva para afirmar que lo que está buscando se puede encontrar antes de la palabra "químico".

Una anticipación positiva se indica mediante un grupo que comienza con ?= .

A continuación, necesitamos un patrón para poner en la anticipación. Tendrá que buscar la palabra "químico" y hacer coincidir todo hasta incluirla. Podemos hacer esto de manera bastante simple afirmando el final de la línea ( $ ), luego buscando el siguiente salto de línea ( \n ) y haciendo coincidir cualquier carácter después de él ( . ) tantas veces como sea posible ( + ). El patrón resultante se parecería a $\n.+ . Supongo que es posible que esta palabra esté en la segunda o incluso en la tercera línea de texto, por lo que necesitaremos crear un grupo que no capture para asegurarnos de que esto no termine en la coincidencia final y sea capaz de emparejarlo varias veces. Un grupo que no captura se denota por un grupo que comienza con ?: . Agregar esto a nuestro patrón existente y permitir que coincida varias veces agregando un cuantificador + se vería como (?:$\n.+)+ . Ahora, la última parte de este patrón es hacer coincidir la palabra real, ¡lo cual es fácil! Podemos poner la palabra en sí después de este patrón así: (?:$\n.+)+chemical . Ahora, la última parte es agregarlo para envolverlo en la anticipación positiva de la que hablamos al principio. Se vería así: (?=(?:$\n.+)+chemical)

Muy bien, ahora, después de ese muro de texto, finalmente podemos crear el patrón que realmente coincida con las marcas de tiempo. Lo que tiene funciona para uno de ellos, pero según su pregunta, parece que desea hacer coincidir ambas marcas de tiempo y la flecha intermedia, por lo que crearé el patrón para hacerlo.

Comencemos con el que proporcionó: [0-9][0-9]:[0-9][0-9]:[0-9][0-9],[0-9][0-9][0-9] . Antes de comenzar a hacer que coincida con ambas marcas de tiempo, simplifiquemos un poco. Esto: \d\d:\d\d:\d\d,\d\d\d hará lo mismo que el patrón que proporcionó, y esto también se puede simplificar un poco. Observe que \d\d: está allí dos veces. Podemos hacer de esto un grupo y decirle que coincida dos veces así: (\d\d:){2} . El patrón acortado se verá como (\d\d:){2}\d\d,\d\d\d . También puede "simplificar" los últimos 3 \d s a \d{3} , pero solo está guardando 1 carácter, así que no me molestaré, pero puede hacerlo si lo desea.

Ahora que se ha simplificado un poco, podemos comenzar a agregarle. Dado que ambas marcas de tiempo tienen el mismo formato, podemos usar un cuantificador para indicarle que coincida varias veces así: ((\d\d:){2}\d\d,\d\d\d)+ . Ahora todo lo que tenemos que hacer es dar cuenta de la flecha en el medio. Podemos usar | para agregar la secuencia de flechas ( --> ) como una coincidencia alternativa para la expresión. En conjunto, se vería así: ((\d\d:){2}\d\d,\d\d\d| --> )+

Finalmente, podemos juntar las dos partes en una sola expresión regular: ((\d\d:){2}\d\d,\d\d\d| --> )+(?=(?:$\n.+)+chemical) . Aquí hay un enlace Regex101 con la expresión con la que puedes jugar.

Me disculpo por la respuesta larga, ¡pero espero que te ayude a aprender un poco más sobre las expresiones regulares!

almost 4 years ago · Juan Pablo Isaza Report

Answer question

Find remote jobs

Accepted Answer · 2022-07-09T09:34:37.196Z

Suponiendo que el formato sea consistente, esto se puede hacer sin expresiones regulares usando split , find e includes :

 const s = `1 00:01:46,356 --> 00:01:49,893 What is this? It's blue. 2 00:01:50,794 --> 00:01:54,998 We used a different chemical process, but it is every bit as pure. 3 00:01:55,199 --> 00:01:58,267 It may be blue, but it's the bomb.`; console.log(s.split("\n\n").find(e => e.includes("chemical")).split("\n")[1]);

0

221

Cómo obtener el patrón de expresiones regulares más cercano basado en un índice de palabras JS

2 answers

0

0

Find remote jobs

Andres GPT